变色龙 (@bianselong) 在 阿里32B新模型比肩满血DeepSeek-R1 中发帖
数学、编程、通用能力,QwQ-32B均可对标DeepSeek-R1。
智东西3月6日报道,今日凌晨,阿里云发布最新推理模型QwQ-32B,性能媲美DeepSeek-R1,在消费级显卡上也能实现本地部署。
要知道其参数量为32B,DeepSeek-R1参数量达到了671B,相差将近20倍。
在数学推理、编程能力上,QwQ-32B的表现与DeepSeek-R1相当,强于o1-mini及相同尺寸的R1蒸馏模型。通用能力测评效果上,QwQ-32B的得分均超越DeepSeek-R1。
苹果的机器学习科学家Awni Hannun(吴恩达学生)发文,展示了QwQ-32B在配备MLX(专门为苹果芯片设计的开源框架)的M4 Max芯片电脑上的运行速度很快。
[图片]
该模型在Hugging Face和ModelScope上以Apache 2.0许可证开源。这意味着它可用于商业和研究用途,因此企业...