时歌 (@Lapis0x0)评OpenAI发布o3&o4mini:喧嚣落幕,长路开启 中发帖

你也可以在我的博客中看到本篇文章的全部内容。 
2023年初,GPT-4横空出世,重塑了人们对大模型“极限”的认知。彼时,GPT-3.5已是业内翘楚,而GPT-4的发布则像是一记重锤,砸下了OpenAI在自然语言处理、逻辑推理、代码生成乃至跨模态理解等多项能力的霸主地位,推动整个行业进入SOTA(State-of-the-Art)不断刷新的加速通道。
两年后,2025年4月16日,OpenAI正式在直播中发布o3和o4mini,模型同步上线ChatGPT官网和客户端。形式上,这是一场延续传统节奏的模型发布会;情感上,它本该是又一次“引领新范式”的时刻。但落实到生产环境,当我们审视OpenAI近期的模型更新,包括最新的o3、o4mini以及前两天的GPT 4.1系列,却发现那种“一骑绝尘”的领先优势似乎正在消退。
无论是在标准评测中被Gemini 2.5 Pro超车,还是在编码能力和长上...