你这是违法行为 (@Anano)Redis创始人反驳「中国大模型靠蒸馏美国模型变强」论调:API答案不能一键复制前沿模型 中发帖

Redis 创始人 Salvatore Sanfilippo 反驳了中国大模型靠蒸馏美国模型变强的说法。他认为,普通 API 只能返回文字答案,拿不到模型生成答案时的概率分布和内部状态,无法靠少量外部调用复制一个前沿模型的核心能力。 
大模型真正的逻辑推理和思考能力隐藏在极其复杂的神经网络内部。通过 API 接口,外部用户只能拿到最终的文字答案,却无法获取模型生成答案时的完整思考路径和概率计算过程。这就像是只看几道题的期末考试答案,根本无法倒推出老师脑海中庞大的知识体系。以 DeepSeek 为代表的中国大模型在崛起中依赖数据预训练和强化学习等底层工程的扎实积累,而不是靠走捷径。
学术界将大模型蒸馏细分为依赖概率分布的「软蒸馏」,以及仅依靠文本答案的「硬蒸馏」。软蒸馏本身是常规的后训练手段,而且不能通过 API 调用就轻易实现,当下的争论主要集中在「硬蒸馏」上。大厂极力防范的其实是规避服...