@HCPTangHY 在 GLM-5-Turbo测评：更贵、更强，平视御三家模型中发帖先放结论 [image] 在私人代码bench上已经可以做到和sonnet 4.6平起平坐的分数

@HCPTangHY 在 GLM-5-Turbo测评：更贵、更强，平视御三家模型中发帖

先放结论 
 [image] 
在私人代码bench上已经可以做到和sonnet 4.6平起平坐的分数。考虑到实际项目上，预估在4.5和4.6之间。 
有一些代码确实眼前一亮 
 [image] 
[image] 
[image] 
甚至还做了无限地图 


不过有些情况还是会有一些小问题，造成bug，需要多次返修，也是丢分的原因之一
该夸夸该骂骂，你智谱这个价格，还闭源，那我就要用闭源模型的标准要求你了 🤓 
 [image] 
0.72/2.3 → 0.96/3.2刀的价格还是小贵啊