Modem_w (@Modemw3294) 在 GPT 5.5发布，一雪前耻还是再度翻车？中发帖叠甲：本帖子不含xxxxxx和某企业关联的新闻，请放心阅读，如有错误请理性讨论并指出，如果你不想看这个帖子点击右上角关掉浏览器（macOS为左上角），请不要恶意举报 ChatGPT 5.5发布OpenAI在4月23日发布了ChatGPT 5.5模型，Terminal Bench 2.0和CyberGym表现出色，前端质量也有很大改善 [image] 为啥没有SWE Bench Pro？报喜不报忧呗

Modem_w (@Modemw3294) 在 GPT 5.5发布，一雪前耻还是再度翻车？中发帖

叠甲：本帖子不含xxxxxx和某企业关联的新闻，请放心阅读，如有错误请理性讨论并指出，如果你不想看这个帖子点击右上角关掉浏览器（macOS为左上角），请不要恶意举报 
ChatGPT 5.5发布
OpenAI在4月23日发布了ChatGPT 5.5模型，Terminal Bench 2.0和CyberGym表现出色，前端质量也有很大改善 
 [image] 
为啥没有SWE Bench Pro？报喜不报忧呗。 
如下是GPT 5.5 vs GPT 5.4 vs Claude Opus 4.6 vs GLM 5.1 VS Kimi 2.6的榜单 
Opus 4.7暂不列出 
编码类




Benchmark
GPT-5.5
GPT-5.4
Claude Opus 4.6
GLM-5.1
Kimi K2.6
领先




SWE-Bench Pro
58.6
57.7
53.4–57.3
5...