0xkk 在 DeepSeek-V3.1 发布了,贴一些相关 SOTA 的 benchmark 报告方便对比 中发帖
补充一些相关 SOTA 的 Benchmark,方便横评参照:
DeepSeek-V3.1
Qwen3 Coder
Kimi K2
ZAI GLM-4.5
Step 3
Claude Opus 4.1
Gemini 2.5 Pro(latest)
GPT-5