Bunn (@BunnHack)微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型 中发帖

近日,中国社交媒体公司微博的人工智能部门推出了开源的 VibeThinker-1.5B,这是一个拥有15亿参数的大型语言模型(LLM)。该模型是基于阿里巴巴的 Qwen2.5-Math-1.5B 进行的精细调整,现已在 Hugging Face、GitHub 和 ModelScope 上免费提供,供研究人员和企业开发者使用,甚至可用于商业目的,遵循 MIT 许可证。 
[17630225779245158132618956908448]
尽管 VibeThinker-1.5B 体积小,但在数学和代码任务上表现出色,达到了行业领先的推理性能,甚至超越了体量达6710亿参数的竞争对手 DeepSeek 的 R1模型。该模型还与 Mistral AI 的 Magistral Medium、Anthropic 的 Claude Opus4和 OpenAI 的 gpt-oss-20B Mediu...