变色龙 (@bianselong) 在 Hugging Face 号召打造完全开源版 DeepSeek R1 大模型 中发帖
根据 Hugging Face 的说法,虽然 DeepSeek 使用的权重是已知的,但用于训练模型的数据集和代码是未知的。通过 Open-R1,Hugging Face 希望填补这些空白。
Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
Hugging Face 表示,它计划建立的合成数据集将不仅关注数学,还将探索其他领域,为科学等其他领域提供帮助。
IT之家附 Open-R1 项目地址如下:
再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型 - IT之家