@SugarBreeze 在腾讯混元发布AutoCodeBench评测标准，多语言高难度能力测评，DeepSeek仍为国内/开源第一中发帖autocodebench.github.io [20250819_203223] 这个结果其实也很合理，毕竟参数量摆在那，应该算是比较客观的评测，因为混元自己的最新模型排在中间的位置

@SugarBreeze 在腾讯混元发布AutoCodeBench评测标准，多语言高难度能力测评，DeepSeek仍为国内/开源第一中发帖

autocodebench.github.io 
 [20250819_203223] 
这个结果其实也很合理，毕竟参数量摆在那，应该算是比较客观的评测，因为混元自己的最新模型排在中间的位置