ZHEN (@zhenhuang) 在 gemini-3.1-pro-preview(high)的上下文应该还是不如gpt-5.2-high :bili_083: 中发帖
让openclaw帮我简单测了一下,用的是这个项目:
其实我也说实话不是很清楚openclaw测的靠不靠谱 😂 仅供参考
[image]
反正结果是这样:
gemini-3.1-pro-preview(non-reasoning)
[telegram-cloud-photo-size-5-6116153817897307889-w]
gemini-3.1-pro-preview(high)
[telegram-cloud-photo-size-5-6116153817897307923-w]
对比的都是gpt-5.2-high,不是xhigh,说是xhigh总是给空回复
所以我不太确定context arena这个结果是不是对的
[Image_2026-02-23_16-00-44_ayqjpgbw.1ee]
渠道:gemini-3.1-pro-prev...