叁月柒 (@MarSeventh)自部署小模型翻译能力测评:7 款 ≤7B 模型 × 5 种语言 × LINUX DO 真实内容 中发帖

从悬赏:自部署小模型对于翻译任务的能力测评继续。 
本文测评在M4的Mac Mini上通过Ollama本地部署完成,覆盖 7 款模型、5 种目标语言和 12 类论坛内容,共 1155 条翻译。

太长不看,可以直接去文末看结论。
1.测评概述
[image]
2.测试环境与部署
[image]
[image]
[image]
3.测试方法
[image]
[image]
4.参测模型一览




模型
参数量
类型
模型大小(Q4_K_M)
来源




Qwen2.5-3B
3B
通用
1.9 GB
阿里通义


Gemma2-2B
2B
通用
1.6 GB
Google


Llama3.2-3B
3B
通用
2.0 GB
Meta


Phi-3.5-mini
3.8B
通用
2.2 GB
Microsoft


Qwen2.5-7B
7B
通用
4.7 GB
...