@AlwaysBeShine来聊聊对 DeepSeek v4 的看法吧 中发帖

我先叠个甲,我以下内容没有唱衰国产大模型的意思,我想尽量说的理性客观一点,个人也有很多地方理解的不足,还希望各位佬指正。 
我个人认为 DeepSeek v4 不会有大家所想的全面超越 Anthropic 和 OpenAI 的旗舰模型,应该还是回归开源大模型的榜首。
可能也限于国外的限制,同时国内对于推理与训练在卡的方面还在追赶状态
DeepSeek 一直拼的都不是自己模型参数有多大,而是在细节上的打磨,是作为用户的我们可能都能想到的方面,是那些当谁一提出来这方面可以优化,自己也能回过味来说出一句“确实”的方面。
最近 Claude Code CLI 源码的泄漏,应该也看到了 Anthropic 让用户感觉赢在体验上的秘密就是对工程化脚手架的细致打磨。
DeepSeek 每次推出新模型的时候,相比于模型性能有多好或者价格有多低,我感觉最有价值的是发表的那些论文,惠及所有人的知识财富...