@ccb 在 阿里发布 Qwen3-235B-Thinking,带思考过程的开源模型 中发帖
阿里发布了 Qwen3 的新版本:Qwen3-235B-A22B-Thinking-2507。
模型参数: 235B
上下文长度: 256K
开源协议: Apache 2.0,免费商用
最大特点: 支持“思考模式”(Thinking Mode),可以输出模型的推理过程。
官方介绍说,这是 4 月份发布的 Qwen3-235B 的升级版。之前的版本是推理和非推理混合的,阿里觉得效果不好,所以这次拆分成了两个专门的版本:一个带 Thinking,一个不带。
相关地址:
GitHub: https://github.com/QwenLM/Qwen3
Hugging Face: https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Thinking-Instruct
在线体验: https://chat.qwen.ai/
看参数挺猛的,不...