重剑无锋 (@HeavySword) 在 LLM & Agent 每日论文阅读计划-D2 中发帖
日期:2026-04-08 00:38
碎碎念
今天来补昨天看DeepSeekV2论文留下的其中之一个坑:旋转位置编码(Rotary Position Embedding,RoPE),话说这个不应该叫旋转位置嵌入吗?由于原文涉及到致死量的数学公式,今天花了大量时间拷打claude进行公式理解。(╯-_-)╯╧╧ 方便起见我只阅读了博客。由于具体内容涉及到致死量的数学公式,因此如果不想看公式的话直接看TL;DR和我的感悟就行´͈ ᵕ `͈
今日阅读论文
标题:ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING
作者单位:苏剑林,追一科技
链接:arxiv | 博客
发表venue:arxiv
年份:2021.4
*ps:苏剑林苏神是月之暗面(KIMI AI)的研究员和知名中文 NLP 技术博主,最广为...