Schrödinger (@synbio) 在 加州大学伯克利分校开源了一个 14B 模型,该模型在编程方面可与 OpenAI 的 o3-mini 和 o1 相媲美! 中发帖
加州大学伯克利分校开源了一个 14B 模型,该模型在编程方面可与 OpenAI 的 o3-mini 和 o1 相媲美!
他们在 24K 个编程问题上对 Deepseek-R1-Distilled-Qwen-14B 应用了 RL。
仅需 32 H100 运行 2.5 周(约 26,880 美元)!
它是真正的开源。他们发布了一切:模型、训练代码、数据集和一篇详细的博客(链接在帖子中)。
终于,我们可以本地运行的一个强大的编程模型。我希望 Sam 能开源一些比这更好的东西。
[image]