𝒳 (@Lays)通义千问的新旗舰 —— Qwen3-Max 中发帖

🚀 Qwen3-Max 来了 —— Qwen 系列迄今为止规模最大、能力最强的模型。 
Qwen3-Max-Base
Qwen3-Max 模型总参数超过 1T,预训练使用了 36T tokens。模型结构沿用了 Qwen3 系列的模型结构设计范式,使用了 Qwen 团队提出的 global-batch load balancing loss。
Qwen3-Max-Instruct
Qwen3-Max-Instruct 的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。
无需思考即可与 SWE-Bench、Tau2-Bench、SuperGPQA、LiveCodeBench 和 AIME25 上的顶级模型相媲美。

[!note]
在专注于解决现实编程挑战的基准测试 SWE-Bench Ve...