作业君 (@homeworkkun) 在 claude疑似使用deepseek-r1蒸馏出来的数据集训练？中发帖消息来源：小红书 [image] [image] 原文： 21号的时候刘聪（@刘聪NLP ）不是发了首个Deepseek蒸馏中文数据集嘛，说用了【无问芯穹】的r1满血版api巴拉巴拉

作业君 (@homeworkkun) 在 claude疑似使用deepseek-r1蒸馏出来的数据集训练？中发帖

消息来源：小红书 
 [image] 
 [image] 
原文： 

21号的时候刘聪（@刘聪NLP ）不是发了首个Deepseek蒸馏中文数据集嘛，说用了【 无问芯穹 】的r1满血版api巴拉巴拉。这个数据集在一段时间还登顶了Hugging Face的总榜，反响很好 
然后25号的时候，号称首个混合推理模型、Claude迄今为止最智能的模型——Claude3.7降世了，横扫各大排行榜 
今天有意思的来了，有朋友发现，为啥用Claude3.7输出的回答，和刘聪的蒸馏数据集的回答，一模一样？ 
（可以看到P2，在用户提一个问题之后，Claude给的输出在结尾处的有一个✨表情，在刘聪的蒸馏数据集同样也出现了✨） 
原来美国的大模型，反应这么快，中国人的数据集发出去三天，就被拿走了哇