天海逍遥 (@biggerm)Qwen3-VL4B 和 8B 版本都有 Instruct 和 Thinking 两种变体 中发帖

VRAM 使用更低 
完整保留 Qwen3-VL 功能
全面表现出色
尽管体积较小,它们的表现优于 Gemini 2.5 Flash Lite 和 GPT-5 Nano 等模型,并且在涵盖 STEM、VQA、OCR、视频理解、代理任务等基准测试中常常超越它们。在许多情况下,它们甚至能与六个月前推出的旗舰模型 Qwen2.5-VL-72B 相媲美!
此外,FP8 版本也提供,以实现高效部署。
[image]
Hugging Face: Qwen3-VL - a Qwen Collection
ModelScope: Qwen3-VL
Qwen3-VL-8B-Instruct API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen...