Mozi (@yeahhe)Open-R1:Huggingface的全开源复现DeepSeek-R1项目(正在进行中) 中发帖

下面内容转载自https://blog.csdn.net/m0_63171455/article/details/145373707?utm_source=chatgpt.com 
Open-R1 项目简介
Open-R1 的目标
构建 DeepSeek-R1 流程中缺失的部分,使每个人都可以复现并在此基础上进行开发。项目整体设计简单,主要包含以下内容:

目录结构与主要脚本
src/
└─ open_r1/
├─ grpo.py # 使用 GRPO 在给定数据集上训练模型
├─ sft.py # 在数据集上对模型进行 SFT(监督微调)
├─ evaluate.py # 在 R1 基准测试上评估模型
└─ generate.py # 使用 Distilabel 从模型生成合成数据

Make...