kejun (@ke_jun)250429 三花 AI 日报:阿里通义 Qwen3 重磅发布;Qafind 实验室发布 ChatDLM;FASHN v1.5 发布;OpenAI 为 ChatGPT 推出原生购物功能 中发帖

阿里通义 Qwen3 重磅发布
[图片]
阿里通义 Qwen3 系列大模型正式推出,本次开源了 2 个 MoE 模型和 6 个密集模型。旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中表现出色,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型不相上下。
小型 MoE 模型 Qwen3-30B-A3B 仅需激活 QwQ-32B 10% 的参数就能实现更优表现;
Qwen3-4B 这样的小模型能匹敌 Qwen2.5-72B-Instruct 的性能
Qwen3 提供两种智能模式选择:

思考模式:像老教授一样深思熟虑,逐步推理后给出答案,专治各种复杂疑难杂症
非思考模式:秒回小能手,适合那些「快给我答案别废话」的简单问题

Qwen3 还特别强化了 Agent 和代码能力,同时加强了对 MC...