Schrödinger (@synbio)Qwen发布了 Qwen2.5VL的技术报告, Qwen2.5-VL-72B,3B, 7B三种模型 中发帖

Qwen发布了 Qwen2.5VL ( https://arxiv.org/abs/2502.13923 ) 的技术报告!  报告全面介绍了Qwen的模型架构和训练细节。 
Qwen2.5-VL-72B 实现了与纯文本基准 Qwen2.5-72B 的能力完全一致。 !它不仅保持了一流的文本理解和生成能力,还拥有业界领先的可视化语义解析能力。 !
这意味着我们现在真正实现了视觉和文本多模态的深度整合!
[image]
[image]
https://huggingface.co/Qwen/Qwen2.5-VL72B-Instruct-AWQ