李成蹊 (@davy) 在 小扎的Meta(Llama)被Deepseek吓到了,逆向分析V3和R1 中发帖
Meta 的生成式 AI 部门陷入恐慌
事情始于 DeepSeek V3 的发布,它在基准测试中已经将 Llama 4 远远甩在身后。更令人雪上加霜的是,一家“训练预算只有 550 万美元的不知名的中国公司”也取得了如此成就。
工程师们正疯狂地分析 DeepSeek,并尽一切可能地复制它的所有东西。我毫不夸张。
管理层正在担心如何为生成式 AI 部门的巨额成本辩护。当生成式 AI 部门的每一个“领导者”的薪酬都超过了 DeepSeek V3 的全部训练成本时,他们将如何面对高层领导?而我们有几十个这样的“领导者”。
DeepSeek R1 的出现让情况变得更加糟糕。我不能透露机密信息,但它很快就会公之于众。
这本来应该是一个以工程为中心的小型组织,但由于一群人为了捞取影响力而蜂拥而至,并人为地抬高了该部门的招聘人数,最终导致所有人受损。