yiming快手自研多模态大语言模型成功引入DSA 中发帖

Keye-VL-2.0-30B-A3B在底层架构上完成了关键跨越——首次在多模态理解场景中成功应用了DSA (DeepSeek Sparse Attention)。 
通过结合稀疏注意力与极具针对性的特征聚合,模型在处理长达小时级的视频序列时,能够有效进行高噪环境下的信息提纯,精准捕捉关键帧并理清动态规律。https://mp.weixin.qq.com/s/gomgqFAZrdbJFQlOfSJxpQ