无恙 (@aiaiAI) 在 Qwen3-30B-A3B 可能是目前最强可部署本地的模型 中发帖
测试在4070 8G上速度可达9 t/s 十分强悍。而同级别的gemma 3 27b 、QwQ 32b,均只有2 t/s 几乎不可用。(均为Q4量化)
[QQ截图20250429094204]
在常见的消费级显卡上,可以说Qwen3-30B-A3B 是目前最强的可部署本地的模型。
[QQ截图20250429094127]