𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷 (@lezishen) 在 英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理 中发帖
据IT之家了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。
[image]
[image]
英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理 - IT之家