ItTakes (@aitech) 在 智谱AI发布开源轻量级视觉推理模型GLM-4.1V-Thinking 中发帖
今天上午,在上海浦东的智谱开放平台产业生态大会上。中国的AI公司中,被OpenAI视为最大威胁的北京智谱华章公司发布了新的开源轻量级视觉推理模型GLM-4.1V-Thinking。类似阿里的QvQ模型。
官网宣称:
GLM-4.1V-Thinking系列模型是目前已知10B级别的VLM模型中性能最强的视觉模型,融合了同级别SOTA的各项视觉语言任务,包括视频理解、图片问答、学科解题、OCR文字识别、文档和图表解读、GUI Agent、前端网页Coding、Grounding等,多项任务能力甚至超过8倍参数量的Qwen2.5-VL-72B。通过领先的强化学习技术,模型掌握了通过思维链推理的方式提升回答的准确性和丰富度,从最终效果和可解释性等维度都显著超过传统的非thinking模型。
该模型的抱抱脸开源地址。
[图...