@Bennett1987DeepSeek 新手上路 中发帖

1. DeepSeek 模型
主力模型
主力模型是DeepSeek首发技术报告中指代的最新&满血版 模型,目前有三个,均为671B参数,64K上下文。

DeepSeek V3

传统LLM (MLA结构和MoE架构) 多用于日常Chat交互场景
推出时间:2024年12月
技术细节参见:Deepseek-V3 Technical Report


DeepSeek R1-Zero

完全依靠强化学习(RL)进行龙场悟道训练,没有经过微调和优化。CoT链完整,但容易输出冗长、重复或者结构混乱的答案。
推出时间:2025年1月
技术细节参见:Deepseek-R1 Technical Report


DeepSeek R1

在R1-Zero基础上进行优化(冷启动数据做SFT/强化学习优化推理效果),显著提高了回答质量和可读性,适合复杂问题思考&具备思维链的Reasoning模型
推出时...