废寝忘食 (@yosen)GLM-4.7 和 M2.1 之外,DeepSeek-V3.2 的编程能力如何 中发帖

先把问题放前面,各位佬友觉得 DeepSeek-V3.2 这个模型的编程和Agent 能力如何?配合哪个脚手架(例如 claude code)的效果比较好?希望得到大家在自己真实场景下的分享 🥹 🥹 
背景
前几天 GLM-4.7 和 M2.1 发布,社区内有不少讨论帖,真是勃勃生机、万物竞发的场景啊!
[image]
[Clipboard_Screenshot_1766465025]
两个模型都声称在各种 benchmark 下都取得了不错的成绩,但是佬友在实测下发现,两个模型都暴露出了一些缺点。这时再回看 benchmark,发现有还有一个国产开源模型依旧摸摸地站在第一梯队——DeepSeek

GLM-4.7、M2.1相关讨论帖节选

简单测评一下glm4.7和M2.1的分析性能
MiniMax M2.1 ,GLM4.7孰强孰弱?
https://linux.do/t/...