变色龙 (@bianselong)通义千问Qwen3系列AI模型正式发布 继续采用开源模式引领AI开源社区发展 中发帖

2025 年 4 月 29 日,阿里巴巴人工智能团队通义千问推出最新的开源大型语言模型系列:Qwen3。根据通义千问团队的介绍,该模型在架构、训练数据、推理效率、多模态能力等多方面实现显著提升,为学术研究、产业应用和开源社区注入新活力。 
通义千问团队提供的权重包括旗舰版 Qwen3-235B-A22B,该模型在编程、数学和通用能力等基准测试中,与 DeepSeek-R1、GPT-o1、GPT-o3-mini、Grok-3 和 Gemini-2.5-Pro 相比取得极具竞争力的优势。
而 Qwen3 的小型 MoE 架构模型 Qwen3-30B-A3B 激活参数量是 QwQ-32B 的 10 倍,得益于混合专家模式,即便是 Qwen3-4B 这类微型模型,其性能也可以与 Qwen2.5-72B-Instruct 相媲美。 通义千问Qwen3系列AI模型正式发布 继续采用开源模式引领AI开...