废寝忘食 (@yosen) 在 GLM-4.7 和 M2.1 之外，DeepSeek-V3.2 的编程能力如何中发帖先把问题放前面，各位佬友觉得 DeepSeek-V3.2 这个模型的编程和Agent 能力如何？配合哪个脚手架（例如 claude code）的效果比较好？希望得到大家在自己真实场景下的分享 🥹 🥹 背景前几天 GLM-4.7 和 M2.1 发布，社区内有不少讨论帖，真是勃勃生机、万物竞发的场景啊！ [image] [Clipboard_Screenshot_1766465025] 两个模型都声称在各种 benchmark 下都取得了不错的成绩，但是佬友在实测下发现，两个模型都暴露出了一些缺点

废寝忘食 (@yosen) 在 GLM-4.7 和 M2.1 之外，DeepSeek-V3.2 的编程能力如何中发帖

先把问题放前面，各位佬友觉得 DeepSeek-V3.2 这个模型的编程和Agent 能力如何？配合哪个脚手架（例如 claude code）的效果比较好？希望得到大家在自己真实场景下的分享 🥹 🥹 
背景
前几天 GLM-4.7 和 M2.1 发布，社区内有不少讨论帖，真是勃勃生机、万物竞发的场景啊！ 
 [image] 
 [Clipboard_Screenshot_1766465025] 
两个模型都声称在各种 benchmark 下都取得了不错的成绩，但是佬友在实测下发现，两个模型都暴露出了一些缺点。这时再回看 benchmark，发现有还有一个国产开源模型依旧摸摸地站在第一梯队——DeepSeek 

GLM-4.7、M2.1相关讨论帖节选 

简单测评一下glm4.7和M2.1的分析性能
MiniMax M2.1 ，GLM4.7孰强孰弱？
https://linux.do/t/...