Modem_w (@Modemw3294) 在 GPT 5.5发布,一雪前耻还是再度翻车? 中发帖
叠甲:本帖子不含xxxxxx和某企业关联的新闻,请放心阅读,如有错误请理性讨论并指出,如果你不想看这个帖子点击右上角关掉浏览器(macOS为左上角),请不要恶意举报
ChatGPT 5.5发布
OpenAI在4月23日发布了ChatGPT 5.5模型,Terminal Bench 2.0和CyberGym表现出色,前端质量也有很大改善
[image]
为啥没有SWE Bench Pro?报喜不报忧呗。
如下是GPT 5.5 vs GPT 5.4 vs Claude Opus 4.6 vs GLM 5.1 VS Kimi 2.6的榜单
Opus 4.7暂不列出
编码类
Benchmark
GPT-5.5
GPT-5.4
Claude Opus 4.6
GLM-5.1
Kimi K2.6
领先
SWE-Bench Pro
58.6
57.7
53.4–57.3
5...