风吹耳朵有点冷 (@okokxw) 在 DeepSeek-R1开创历史,梁文锋论文登上《自然(Nature)》的封面 中发帖
由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。
内容重点(来源:知乎回答)
DeepSeek R1 论文登上了最新一期的 Nature 封面!梁文锋署名通讯作者!Nature 还专门为此写了篇社论夸赞 DeepSeek 的技术开放性,并呼吁更多企业主动发表大模型学术成果。
R1 模型成本首次公开,用 H800 训练,从 V3-base 训练成 R1,只花了 29.4 万美元!
在经受同行评议时正面...