@x1a0y4o 在 DeepSeek V4 个人技术前瞻中发帖▶ 前言自2025年春节DeepSeek-R1的论文爆火以后，Deepseek不仅为这个世界贡献了RL路线的推理模型技术方案，更是以其低廉的模型训练成本，震惊了当下的大模型业界

@x1a0y4o 在 DeepSeek V4 个人技术前瞻中发帖

▶ 
前言
自2025年春节DeepSeek-R1的论文爆火以后，Deepseek不仅为这个世界贡献了RL路线的推理模型技术方案，更是以其低廉的模型训练成本，震惊了当下的大模型业界。而今距离石破天惊已然过了一个春秋，回顾这一年里，不仅各家厂商如雨后春笋般推出了众多优秀模型，更有ClaudeCode引领的Agentic Task应用范式迭代。闭源模型有御三家激烈竞争，GPT-5 Pro、Claude Opus 4.6和Gemini 3.1 Pro各自留下了浓墨重彩，国内的Kimi-2.5/GLM-5/MiniMax-2.5也不遑多让，Qwen 3.5更是可谓挑起了开源模型的大梁。而在此风云下，DeepSeek V3.2系列固然让人看到不少亮点，但是也对V4抱有更多期待。那么本文就以近期DeepSeek-AI的多篇研究工作入手，对即将到来的新一代基模进行预测，笔者才学有限，如有谬误之处还请不吝指出...