@Xcating[#0x1] 中-英翻译小模型社区语料测评报告 中发帖

0x100 基本环境

[!TIP]
测试环境为M4 Macbook Mini 16GB,使用LM Studio对5个小模型进行翻译测试。测试使用的自部署模型参数:temperature=0,max_tokens=4096,除了GPT 5.4外无思考。本次测试使用使用 由7378条社区帖子、社区FAQ摘录、标签/板块 中精选、调优的30条结构化语料进行测试。
无模型调优/无术语表

系统提示词(AI生成的):
[HsaSQsjA16@2x]
0x200 测评方法

点击:展开
0x300 测评结果
0x301 最终榜单

[!NOTE]
小模型榜中的 5 个模型是在同一台机器、同一端点、同一系统提示词、同一参数下测试。

小模型榜




排名
模型
综合分
平均延迟
速度
结论




1
qwen3.5-9b
78.2
19.28 s
12.01 tok/s
准确性冠军...