longlong (@EricOnly) 在阿里正式发布Qwen3-235B-A22B-Thinking-2507 中发帖✨ 模型简介我们隆重介绍 Qwen3-235B-A22B-Thinking-2507！这是 Qwen3-235B-A22B 的最新升级版，专为提升“推理能力”和处理高难度推理任务而打造

longlong (@EricOnly) 在阿里正式发布Qwen3-235B-A22B-Thinking-2507 中发帖

✨ 模型简介 
我们隆重介绍 Qwen3-235B-A22B-Thinking-2507！这是 Qwen3-235B-A22B 的最新升级版，专为提升“推理能力”和处理高难度推理任务而打造。模型拥有2350亿总参数和220亿激活参数 ，原生支持256K（即262,144）tokens的超长上下文。 
🚀 升级亮点 
ꔷ 逻辑推理、数学、科学和编码等任务上的性能显著提升，在开源推理模型中达到SOTA水平； 
ꔷ 通用能力也大幅增强，包括指令遵循、工具使用和文本生成等； 
ꔷ 模型的256K长上下文理解能力也得到了强化，我们强烈建议在高度复杂的推理任务中使用它； 
🏆 测评结果 
Qwen3-235B-A22B-Thinking-2507在多个权威基准测试中表现超群，模型在推理任务HMMT25、编码任务LiveCodeBench v6和CFEval、知识任务SuperGPQA以及多语言任务Po...