十点还有几分钟 (@AstraSolis)我去,DeepSeekv4 真的发布了 中发帖

DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求 
[1000007443.png]
[1000007442.png]
[1000007444.png]