@Bennett1987 在 DeepSeek 新手上路 中发帖
1. DeepSeek 模型
主力模型
主力模型是DeepSeek首发技术报告中指代的最新&满血版 模型,目前有三个,均为671B参数,64K上下文。
DeepSeek V3
传统LLM (MLA结构和MoE架构) 多用于日常Chat交互场景
推出时间:2024年12月
技术细节参见:Deepseek-V3 Technical Report
DeepSeek R1-Zero
完全依靠强化学习(RL)进行龙场悟道训练,没有经过微调和优化。CoT链完整,但容易输出冗长、重复或者结构混乱的答案。
推出时间:2025年1月
技术细节参见:Deepseek-R1 Technical Report
DeepSeek R1
在R1-Zero基础上进行优化(冷启动数据做SFT/强化学习优化推理效果),显著提高了回答质量和可读性,适合复杂问题思考&具备思维链的Reasoning模型
推出时...