XGM感觉立方体水位计算并不是测试模型的银弹 中发帖

比较纯净的美国线路,Anthropic Google OpenAI三家Cli官方api key直连调用,sk-ant-\sk-proj-\vertex json,模型用的是opus-4.5(开启MAX_THINKING_TOKENS)\gemini-3-pro-preview\gpt-5.1-codex-max,得到的结果是claude一直答不对,快且笃定27.6cm,gemini和codex是一直能答对,gemini还写py验证,codex慢但是准,难道是模型基础能力问题 🫪 
[image]
[image]