CZ (@beilin)QwQ AI 更新最新的 qwen3 系列模型 中发帖

直接体验全部版本:Qwen 3 
阿里云团队今天宣布推出 Qwen3 系列大型语言模型。新系列在代码、数学、通用能力等基准测试中与顶级模型(如DeepSeek-R1、o1、Grok-3等)表现相当。
亮点与特性

双重思考模式:支持"思考模式"(深度推理)和"非思考模式"(快速响应),用户可灵活控制模型推理深度
广泛语言支持:覆盖119种语言和方言
增强Agent能力:优化了代码与环境交互能力

开源模型列表
MoE模型(混合专家模型):

Qwen3-235B-A22B:2350亿总参数,220亿激活参数
Qwen3-30B-A3B:300亿总参数,30亿激活参数

Dense模型(全参数模型):

Qwen3-32B(64层,128K上下文)
Qwen3-14B(40层,128K上下文)
Qwen3-8B(36层,128K上下文)
Qwen3-4B(36层,32K上下文)
Qwe...