@HCPTangHYGLM-5-Turbo测评:更贵、更强,平视御三家模型 中发帖

先放结论 
[image]
在私人代码bench上已经可以做到和sonnet 4.6平起平坐的分数。考虑到实际项目上,预估在4.5和4.6之间。
有一些代码确实眼前一亮
[image]
[image]
[image]
甚至还做了无限地图


不过有些情况还是会有一些小问题,造成bug,需要多次返修,也是丢分的原因之一
该夸夸该骂骂,你智谱这个价格,还闭源,那我就要用闭源模型的标准要求你了 🤓
[image]
0.72/2.3 → 0.96/3.2刀的价格还是小贵啊