@fengchris 在阿里开源QwenLong-L1-32B 长上下文推理模型中发帖QwenLong-L1-32B，这是首个专为长上下文推理而以强化学习（RL）训练的长上下文语言推理模型（LRM）

@fengchris 在阿里开源QwenLong-L1-32B 长上下文推理模型中发帖

QwenLong-L1-32B，这是首个专为长上下文推理而以强化学习（RL）训练的长上下文语言推理模型（LRM）。在七个长上下文DocQA基准测试中的实验结果表明，QwenLong-L1-32B优于旗舰型LRM，如OpenAI-o3-mini和Qwen3-235B-A22B，其性能可媲美Claude-3.7-Sonnet-Thinking，在当前最先进的LRM中表现领先。 
 [image] 
 [image] 
仓库：GitHub - Tongyi-Zhiwen/QwenLong-L1 
模型：Tongyi-Zhiwen/QwenLong-L1-32B · Hugging Face