longlong (@EricOnly) 在 阿里正式发布Qwen3-235B-A22B-Thinking-2507 中发帖
✨ 模型简介
我们隆重介绍 Qwen3-235B-A22B-Thinking-2507!这是 Qwen3-235B-A22B 的最新升级版,专为提升“推理能力”和处理高难度推理任务而打造。模型拥有2350亿总参数和220亿激活参数 ,原生支持256K(即262,144)tokens的超长上下文。
🚀 升级亮点
ꔷ 逻辑推理、数学、科学和编码等任务上的性能显著提升,在开源推理模型中达到SOTA水平;
ꔷ 通用能力也大幅增强,包括指令遵循、工具使用和文本生成等;
ꔷ 模型的256K长上下文理解能力也得到了强化,我们强烈建议在高度复杂的推理任务中使用它;
🏆 测评结果
Qwen3-235B-A22B-Thinking-2507在多个权威基准测试中表现超群,模型在推理任务HMMT25、编码任务LiveCodeBench v6和CFEval、知识任务SuperGPQA以及多语言任务Po...