@SugarBreeze 在 腾讯混元发布AutoCodeBench评测标准,多语言高难度能力测评,DeepSeek仍为国内/开源第一 中发帖
autocodebench.github.io
[20250819_203223]
这个结果其实也很合理,毕竟参数量摆在那,应该算是比较客观的评测,因为混元自己的最新模型排在中间的位置