@JackBlue百度开源 Qianfan-VL系列视觉模型 中发帖

模型介绍
Qianfan-VL模型系列是在企业级应用多模态大模型的场景中进行强化的通用多模态大模型,具备基础的通用能力,同时在产业落地的高频场景有深度的优化。通过三大核心功能,精准满足不同场景下的多模态理解需求。
核心特性
🚀 多尺寸模型
提供3B、8B、70B三种规格的模型,满足从端侧到云端的不同场景需求
📝 OCR与文档理解增强

全场景OCR识别:支持手写体、印刷体、场景文字、公式等多种文字识别
复杂版面理解:表格解析、图表理解、文档结构化等能力
多语言支持:中英文及多语言文档处理能力

🧠 思考推理能力
8B和70B模型支持思维链(Chain-of-Thought)能力,在数学、推理计算等复杂场景展现卓越表现,可应用于辅助教学、拍照解题、自动判题等场景
模型规格




模型名称
参数量
上下文长度
支持思考
适用场景
模型下载




Qianfan...