作业君 (@homeworkkun) 在 claude疑似使用deepseek-r1蒸馏出来的数据集训练? 中发帖
消息来源:小红书
[image]
[image]
原文:
21号的时候刘聪(@刘聪NLP )不是发了首个Deepseek蒸馏中文数据集嘛,说用了【 无问芯穹 】的r1满血版api巴拉巴拉。这个数据集在一段时间还登顶了Hugging Face的总榜,反响很好
然后25号的时候,号称首个混合推理模型、Claude迄今为止最智能的模型——Claude3.7降世了,横扫各大排行榜
今天有意思的来了,有朋友发现,为啥用Claude3.7输出的回答,和刘聪的蒸馏数据集的回答,一模一样?
(可以看到P2,在用户提一个问题之后,Claude给的输出在结尾处的有一个✨表情,在刘聪的蒸馏数据集同样也出现了✨)
原来美国的大模型,反应这么快,中国人的数据集发出去三天,就被拿走了哇