Twilight (@Twilight9)DeepSeek团队揭秘:清北应届生撑起AI创新一片天 中发帖

DeepSeek-v3大模型的横空出世,不仅震撼了AI圈,也让其背后的团队成为全网关注的焦点。这支以清北应届生为核心的年轻团队,凭借创新能力和高效协作,成为AI领域的一股新生力量。 
年轻团队撑起创新大旗
DeepSeek团队的最大特点是年轻化,成员多为应届生或在读生,尤其是来自清华、北大的顶尖人才。他们不仅在学术上表现出色,还在DeepSeek的研究中做出了重要贡献。例如,高华佐(北大物理系毕业)和曾旺丁(北邮研究生)为DeepSeek-V2的MLA架构提出了关键创新,而MLA(Multi-head Latent Attention)替代了传统的多头注意力机制,大幅降低了计算量和推理显存需求。
此外,DeepSeek-Math项目提出的GRPO(Group Relative Policy Optimization)算法,也在业内引起广泛关注。GRPO是PPO的变体,通过群体得分估算ba...