jiangjian (@adacic) 在 OpenAI o3 压轴，迈向 AGI 中发帖“12 Days of OpenAI”活动已拉上帷幕，OpenAI 的 o3 系列大模型压台登场，OpenAI在其为期12个工作日的线上新品发布活动最后一日宣布推出下一代模型o3及其精简版o3-mini

jiangjian (@adacic) 在 OpenAI o3 压轴，迈向 AGI 中发帖

“12 Days of OpenAI”活动已拉上帷幕，OpenAI 的 o3 系列大模型压台登场，OpenAI在其为期12个工作日的线上新品发布活动最后一日宣布推出下一代模型o3及其精简版o3-mini。o3在多个方面显著超越了其前代o1，在软件工程、竞赛数学和掌握人类博士级别的自然科学知识能力等方面表现出色。尤其在ARC-AGI评估中，o3的成绩达到75.7%至87.5%，超过了人类水平的85%门槛。OpenAI声称，至少在某些条件下，其推理能力非常接近通用人工智能（AGI）。 
o3 模型推理
OpenAI o3 模型和主流 AI 模型的一个最大不同点，在于会展开事实核查，从而可以规避一些常见的模型陷阱，但这个过程会产生响应延迟，根据推理难度，通常是几秒到几分钟。 
o3 系列模型的另一个亮点是使用“私人思想链”（private chain of thought）进行“思考”，它可以在...