wsa01378图一乐 claude-opus-4-6对国内模型进行评测 中发帖

能力项
ali-kimi-k2.5
ali-MiniMax-M2.5
ali-qwen3.5-plus
ali-glm-5
gemini-3-flash
gemini-3.1-pro-low




基础知识
精准
答错(答成2023得主)
精准
精准
精准
精准


中文能力
流畅
流畅但啰嗦
超时60s
流畅
流畅精炼
流畅


数学推理
正确(f(2)=3)
正确
正确
正确
正确
正确


代码能力
简洁
可用
可用
可用但慢
简洁
可用


逻辑推理
精准
正确
正确
正确
精准
正确


频率限制
无限制
无限制
无限制
无限制
无限制
无限制


平均响应
2.4s
🐢 10.1s
🐢 20.3s
🐢 24.2s
3....