@HCPTangHY阶跃星辰开源STEP3-VL-10B:10B参数多模态AI效率极限 中发帖

阶跃星辰StepFun正式开源了全新的多模态基础模型STEP3-VL-10B。该模型以10B的参数规模,在视觉感知、复杂推理和人类意图对齐方面展现出惊人实力。它不仅刷新了众多上百B模型的性能天花板,更在多项核心测试中越级击败或追平了体量大其10至20倍的行业巨兽,如GLM-4.6V、Qwen3-VL甚至谷歌的Gemini 2.5 Pro。 
[image]
这一“小打大”的奇迹主要体现在理科推理与视觉感知领域。在2025年美国数学邀请赛(AIME)基准测试中,STEP3-VL-10B取得了94.43%的统治级成绩,同时在GUI理解、OCR以及具身智能所需的空间推理能力上均达到SOTA。这意味着,无论是解析复杂的数学图表,还是精准识别手机屏幕上的微小图标,该模型都能以极低的算力成本完成以往需要更大规模模型才能胜任的工作。
STEP3-VL-10B之所以能实现效率跃升,得益于其独特的训练...