CHEN (@EDWINCHENC)LiveBench放榜:QwQ-32B冲进全球前五,成为「全球性能No.1的开源模型」 中发帖

[image] 
3月17日,阿里通义千问最新开源的推理模型QwQ-32B​,在国际权威测评榜LiveBench中,超越OpenAI-GPT-4.5-preview、Google-Gemini2.0、DeepSeek-R1等国内外顶尖模型,🚀冲进全球前五,成为「全球性能No.1的开源模型」。
[image]
📖关于「LiveBench」
LiveBench是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对QwQ-32B的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估,采用自动评分,与标准答案直接对比,是一个更注重正确性的客观LLM评测标准。该榜单采用不断更新的实时题库及数据,杜绝了模型提前针对性训练及微调的可能性。
🌟感谢大家的喜爱
千问QwQ-32B开源当天即登顶Hugging Face模型榜单榜首👏...