ZHEN (@zhenhuang) 在 gemini-3.1-pro-preview(high)的上下文应该还是不如gpt-5.2-high :bili_083: 中发帖让openclaw帮我简单测了一下，用的是这个项目：其实我也说实话不是很清楚openclaw测的靠不靠谱 😂 仅供参考 [image] 反正结果是这样： gemini-3.1-pro-preview(non-reasoning) [telegram-cloud-photo-size-5-6116153817897307889-w] gemini-3.1-pro-preview(high) [telegram-cloud-photo-size-5-6116153817897307923-w] 对比的都是gpt-5.2-high，不是xhigh，说是xhigh总是给空回复所以我不太确定context arena这个结果是不是对的 [Image_2026-02-23_16-00-44_ayqjpgbw.1ee] 渠道：gemini-3.1-pro-prev...

ZHEN (@zhenhuang) 在 gemini-3.1-pro-preview(high)的上下文应该还是不如gpt-5.2-high :bili_083: 中发帖

让openclaw帮我简单测了一下，用的是这个项目： 

其实我也说实话不是很清楚openclaw测的靠不靠谱 😂 仅供参考 
 [image] 
反正结果是这样： 
gemini-3.1-pro-preview(non-reasoning) 
 [telegram-cloud-photo-size-5-6116153817897307889-w] 
gemini-3.1-pro-preview(high) 
 [telegram-cloud-photo-size-5-6116153817897307923-w] 
对比的都是gpt-5.2-high，不是xhigh，说是xhigh总是给空回复 
所以我不太确定context arena这个结果是不是对的 
 [Image_2026-02-23_16-00-44_ayqjpgbw.1ee] 


渠道：gemini-3.1-pro-prev...