𝒳 (@Lays)Qwen3-VL 系列—— Qwen 系列中最强大的视觉语言模型 中发帖

🚀 Qwen 正式推出全新升级的 Qwen3-VL 系列 —— 这是迄今为止 Qwen 系列中最强大的视觉语言模型。 
旗舰模型 Qwen3-VL-235B-A22B 现已开源,提供 Instruct 和 Thinking 两个版本:
Instruct 版本在关键视觉基准测试上超越 Gemini 2.5 Pro
Thinking 版本在多模态推理任务上达到业界领先水平(SOTA)
主要突破:
🖥 视觉代理:在 PC / 手机上操作 GUI—— 理解按钮、调用工具并完成真实世界任务(在 OS World 上达到 SOTA)
💻 视觉编码:将屏幕截图转换为代码(HTML/CSS/JS,Draw.io)—— 真正的 “所见即所得” 开发
📚 256K+ 上下文(可扩展到 1M)→ 支持 2 小时视频和多页长 PDF
🌍 32 种语言的 OCR,增强了对模糊、倾斜或稀有字...