天海逍遥 (@biggerm) 在 Qwen3-VL4B 和 8B 版本都有 Instruct 和 Thinking 两种变体中发帖VRAM 使用更低完整保留 Qwen3-VL 功能全面表现出色尽管体积较小，它们的表现优于 Gemini 2.5 Flash Lite 和 GPT-5 Nano 等模型，并且在涵盖 STEM、VQA、OCR、视频理解、代理任务等基准测试中常常超越它们

天海逍遥 (@biggerm) 在 Qwen3-VL4B 和 8B 版本都有 Instruct 和 Thinking 两种变体中发帖

VRAM 使用更低 
完整保留 Qwen3-VL 功能 
全面表现出色 
尽管体积较小，它们的表现优于 Gemini 2.5 Flash Lite 和 GPT-5 Nano 等模型，并且在涵盖 STEM、VQA、OCR、视频理解、代理任务等基准测试中常常超越它们。在许多情况下，它们甚至能与六个月前推出的旗舰模型 Qwen2.5-VL-72B 相媲美！ 
此外，FP8 版本也提供，以实现高效部署。 
 [image] 
Hugging Face: Qwen3-VL - a Qwen Collection 
ModelScope: Qwen3-VL 
Qwen3-VL-8B-Instruct API： https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen...