路人A (@passerby064857) 在 基准测试DeepSWE的新分数出炉,含Fable-5、Kimi K2.7 Code的跑分 中发帖
2026年6月19日的更新,新的v1.1跑分
Fable-5(70%)大于GPT5.5(67%),差距不大
Kimi K2.7 Code超越Sonnet4.6
原文:
DeepSWE
[image]
[image]