@Bennett1987 在 DeepSeek 新手上路中发帖1. DeepSeek 模型主力模型主力模型是DeepSeek首发技术报告中指代的最新&满血版模型，目前有三个，均为671B参数，64K上下文

@Bennett1987 在 DeepSeek 新手上路中发帖

1. DeepSeek 模型
主力模型
主力模型是DeepSeek首发技术报告中指代的最新&满血版 模型，目前有三个，均为671B参数，64K上下文。 

DeepSeek V3

传统LLM （MLA结构和MoE架构） 多用于日常Chat交互场景
推出时间：2024年12月
技术细节参见：Deepseek-V3 Technical Report


DeepSeek R1-Zero

完全依靠强化学习(RL)进行龙场悟道训练，没有经过微调和优化。CoT链完整，但容易输出冗长、重复或者结构混乱的答案。
推出时间：2025年1月
技术细节参见：Deepseek-R1 Technical Report


DeepSeek R1

在R1-Zero基础上进行优化(冷启动数据做SFT/强化学习优化推理效果)，显著提高了回答质量和可读性，适合复杂问题思考&具备思维链的Reasoning模型
推出时...