@Astralyn 在 Frontier Code 更新 GLM-5.2 & K2.7 Code 成绩 中发帖
Devin (Cognition 子公司,前身为 Windsurf) 发布报告,更新了 GLM-5.2 与 K2.7 Code 两款模型在 Frontier Code 榜单上的成绩;该榜单宣称重点考察大模型生成的代码是否能被人类维护者合并进入仓库。
基准测试覆盖情况
[image]
本次更新部分
[image]
历史榜单成绩
[image]