黑猫警长1000000000 (@Hmjz100) 在 【快讯】Qwen3-Next-80B-A3B 发布 中发帖
Qwen3-Next 是一种采用稀疏 MoE、线性注意力和多 token 预测的下一代架构,具备旗舰级的指令遵循和推理能力,在超长上下文理解与复杂任务处理方面表现出色。
其原生支持高达 262,144 个 token 的上下文长度。
Qwen3-Next-80B-A3B 已上线 Qwen Chat