变色龙 (@bianselong)OpenAI推出新推理模型GPT-o3和o4-mini 可访问外部工具如浏览器或Python解释器 中发帖

其中 o3 模型是目前 OpenAI 最强大的推理模型,在 Codeforces、SWE-bench 和 MMMU 基准测试中都创下了新的 SOTA 基准,该模型还支持图像上传,因此用户也可以用这个模型分析图像、图标和图形等。 
o4-mini 则是个体积较小的模型,该模型的特点是速度更快和成本更低,尽管模型体积较小但该模型在数学、编程和视觉任务方面的表现和 o3 相当,在 AIME 2025 竞赛中 o4-mini 与 Python 解释器配合使用时得分为 99.5%,由于该模型效率比 o3 还要高,因此在处理高容量的推理任务时 o4-mini 模型更好。
OpenAI 称这两个新模型给出的响应都更加自然和更具对话性,因为模型可以参考记忆和过去的对话,OpenAI 在底层使用大规模强化学习来提升性能,也通过强化学习来训练这个两个模型使用外部工具。
客户端方面 ChatGPT 付费订阅...