李成蹊 (@davy) 在小扎的Meta(Llama)被Deepseek吓到了，逆向分析V3和R1 中发帖Meta 的生成式 AI 部门陷入恐慌事情始于 DeepSeek V3 的发布，它在基准测试中已经将 Llama 4 远远甩在身后

李成蹊 (@davy) 在小扎的Meta(Llama)被Deepseek吓到了，逆向分析V3和R1 中发帖

Meta 的生成式 AI 部门陷入恐慌 
事情始于 DeepSeek V3 的发布，它在基准测试中已经将 Llama 4 远远甩在身后。更令人雪上加霜的是，一家“训练预算只有 550 万美元的不知名的中国公司”也取得了如此成就。 
工程师们正疯狂地分析 DeepSeek，并尽一切可能地复制它的所有东西。我毫不夸张。 
管理层正在担心如何为生成式 AI 部门的巨额成本辩护。当生成式 AI 部门的每一个“领导者”的薪酬都超过了 DeepSeek V3 的全部训练成本时，他们将如何面对高层领导？而我们有几十个这样的“领导者”。 
DeepSeek R1 的出现让情况变得更加糟糕。我不能透露机密信息，但它很快就会公之于众。 
这本来应该是一个以工程为中心的小型组织，但由于一群人为了捞取影响力而蜂拥而至，并人为地抬高了该部门的招聘人数，最终导致所有人受损。