@haha123 在 GLM4.7 是不是国产里,用在 claude code 里最好的模型? 中发帖
我这几天 试过 qwen3、 deepseek 3.2, qlm4.7, claude
在 claude code 里, 测试 技能的触发;
我对每个模型手工测试了 6 次, 发送某个关键词,看能不能触发技能
我的测试结果:
claude : 100% (cc switch 推荐的模型,具体哪个没有去细查)
glm 4.7 : 6 次里成功了 2 次
deepseek3.2 :6 次里成功了 1 次
qwen : 0% (我没成功过)
–
技能都是我随便手写了几个测试的,技能描述也写的很差, 测试结果 有些飘忽不定
有时候换关键词, glm 概率能到 40 %, deepseek 有时候概率比 glm 更高;
我感觉 qwen 一直垫底,猜测是他们的模型没有针对 skill 做训练
测试结果也跟我的技能编写水平有关