wsa01378 在 图一乐 claude-opus-4-6对国内模型进行评测 中发帖
能力项
ali-kimi-k2.5
ali-MiniMax-M2.5
ali-qwen3.5-plus
ali-glm-5
gemini-3-flash
gemini-3.1-pro-low
基础知识
✅ 精准
⚠ 答错(答成2023得主)
✅ 精准
✅ 精准
✅ 精准
✅ 精准
中文能力
✅ 流畅
✅ 流畅但啰嗦
❌ 超时60s
✅ 流畅
✅ 流畅精炼
✅ 流畅
数学推理
✅ 正确(f(2)=3)
✅ 正确
✅ 正确
✅ 正确
✅ 正确
✅ 正确
代码能力
✅ 简洁
✅ 可用
✅ 可用
✅ 可用但慢
✅ 简洁
✅ 可用
逻辑推理
✅ 精准
✅ 正确
✅ 正确
✅ 正确
✅ 精准
✅ 正确
频率限制
✅ 无限制
✅ 无限制
✅ 无限制
✅ 无限制
✅ 无限制
✅ 无限制
平均响应
⚡ 2.4s
🐢 10.1s
🐢 20.3s
🐢 24.2s
⚡ 3....