彼方 (@bifangKNT) 在 gpt5.2 swe分数似乎赶上o4.5了? 中发帖
[image]
[image]
[SWE-Bench Pro(公开版)_软件工程]
另外,提升最大的我感觉是长上下文准确性:
[OpenAI MRCRv2 (4-needle)_长上下文]
[OpenAI MRCRv2 (8-needle)_长上下文]
多模态能力似乎提升也不小:
[CharXiv Reasoning_科学图表类问题]
[ScreenSpot-Pro_GUI 截图理解]
更多信息: 隆重推出 GPT-5.2 | OpenAI