@fengchris阿里开源QwenLong-L1-32B 长上下文推理模型 中发帖

QwenLong-L1-32B,这是首个专为长上下文推理而以强化学习(RL)训练的长上下文语言推理模型(LRM)。在七个长上下文DocQA基准测试中的实验结果表明,QwenLong-L1-32B优于旗舰型LRM,如OpenAI-o3-mini和Qwen3-235B-A22B,其性能可媲美Claude-3.7-Sonnet-Thinking,在当前最先进的LRM中表现领先。 
[image]
[image]
仓库:GitHub - Tongyi-Zhiwen/QwenLong-L1
模型:Tongyi-Zhiwen/QwenLong-L1-32B · Hugging Face