@x1a0y4oDeepSeek V4 个人技术前瞻 中发帖

 
前言
自2025年春节DeepSeek-R1的论文爆火以后,Deepseek不仅为这个世界贡献了RL路线的推理模型技术方案,更是以其低廉的模型训练成本,震惊了当下的大模型业界。而今距离石破天惊已然过了一个春秋,回顾这一年里,不仅各家厂商如雨后春笋般推出了众多优秀模型,更有ClaudeCode引领的Agentic Task应用范式迭代。闭源模型有御三家激烈竞争,GPT-5 Pro、Claude Opus 4.6和Gemini 3.1 Pro各自留下了浓墨重彩,国内的Kimi-2.5/GLM-5/MiniMax-2.5也不遑多让,Qwen 3.5更是可谓挑起了开源模型的大梁。而在此风云下,DeepSeek V3.2系列固然让人看到不少亮点,但是也对V4抱有更多期待。那么本文就以近期DeepSeek-AI的多篇研究工作入手,对即将到来的新一代基模进行预测,笔者才学有限,如有谬误之处还请不吝指出...