@SmallMain记一次对 GPT-5.4 全系列 / Qwen3.5 (端侧小参数) 的真实项目需求的横向评测 中发帖

项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:

第一轮
第二轮
第三轮
第四轮
第五轮
第六轮

我对这次 Qwen3.5 出的小参数端侧模型比较感兴趣,之前我测试过几次小参数模型,可以说如果能够不重复、正常进行工具调用就已经很不错了。
所以这次除了 GPT-5.4 系列之外,我选了两款最近比较热门的 Qwen3.5 9B 和 35BA3B 的版本来测试,它们都是 Q4 量化版的,之所以不测试精度更高的版本是因为考虑到推理速度。
我的设备(MBP M4 Pro 48GB)在跑 9B 时大概能达到 19 - 29 tps,在跑 35BA3B 时 20 - 28 tps。
模型来源

Qwen 3.5 系列: 本地部署,量化模型来自 unsloth,分别是 Qwen3.5 ...