时歌 (@Lapis0x0) 在评OpenAI发布o3&o4mini：喧嚣落幕，长路开启中发帖你也可以在我的博客中看到本篇文章的全部内容

时歌 (@Lapis0x0) 在评OpenAI发布o3&o4mini：喧嚣落幕，长路开启中发帖

你也可以在我的博客中看到本篇文章的全部内容。 
2023年初，GPT-4横空出世，重塑了人们对大模型“极限”的认知。彼时，GPT-3.5已是业内翘楚，而GPT-4的发布则像是一记重锤，砸下了OpenAI在自然语言处理、逻辑推理、代码生成乃至跨模态理解等多项能力的霸主地位，推动整个行业进入SOTA（State-of-the-Art）不断刷新的加速通道。 
两年后，2025年4月16日，OpenAI正式在直播中发布o3和o4mini，模型同步上线ChatGPT官网和客户端。形式上，这是一场延续传统节奏的模型发布会；情感上，它本该是又一次“引领新范式”的时刻。但落实到生产环境，当我们审视OpenAI近期的模型更新，包括最新的o3、o4mini以及前两天的GPT 4.1系列，却发现那种“一骑绝尘”的领先优势似乎正在消退。 
无论是在标准评测中被Gemini 2.5 Pro超车，还是在编码能力和长上...