Twilight (@Twilight9)DeepSeek V3 “报错家门” 引发热议,AI 模型身份混淆成焦点 中发帖

近日,DeepSeek V3 因一个简单的问号缺失,竟自称是 ChatGPT,引发广泛讨论。这一 “报错家门” 的现象不仅让用户感到困惑,也引发了对该模型训练数据的质疑。尽管有猜测认为 DeepSeek V3 可能基于 ChatGPT 的输出进行训练,但专家指出,这种可能性较低,因为 ChatGPT 的影子在几乎所有后续大模型中都有体现。 
AI 模型身份混淆的背后原因
TechCrunch 指出,AI 公司获取数据的网络环境正被 “AI 垃圾” 充斥,导致训练数据难以完全过滤 AI 生成的内容。AI Now Institute 的首席科学家 Heidy Khlaaf 也提到,开发者为了节约成本,倾向于从现有 AI 模型中 “蒸馏” 知识,这可能导致模型在训练过程中意外接触到 ChatGPT 等模型的输出。
[image]