变色龙 (@bianselong) 在 OpenAI推出新推理模型GPT-o3和o4-mini 可访问外部工具如浏览器或Python解释器中发帖其中 o3 模型是目前 OpenAI 最强大的推理模型，在 Codeforces、SWE-bench 和 MMMU 基准测试中都创下了新的 SOTA 基准，该模型还支持图像上传，因此用户也可以用这个模型分析图像、图标和图形等

变色龙 (@bianselong) 在 OpenAI推出新推理模型GPT-o3和o4-mini 可访问外部工具如浏览器或Python解释器中发帖

其中 o3 模型是目前 OpenAI 最强大的推理模型，在 Codeforces、SWE-bench 和 MMMU 基准测试中都创下了新的 SOTA 基准，该模型还支持图像上传，因此用户也可以用这个模型分析图像、图标和图形等。 
o4-mini 则是个体积较小的模型，该模型的特点是速度更快和成本更低，尽管模型体积较小但该模型在数学、编程和视觉任务方面的表现和 o3 相当，在 AIME 2025 竞赛中 o4-mini 与 Python 解释器配合使用时得分为 99.5%，由于该模型效率比 o3 还要高，因此在处理高容量的推理任务时 o4-mini 模型更好。 
OpenAI 称这两个新模型给出的响应都更加自然和更具对话性，因为模型可以参考记忆和过去的对话，OpenAI 在底层使用大规模强化学习来提升性能，也通过强化学习来训练这个两个模型使用外部工具。 
客户端方面 ChatGPT 付费订阅...