klyang (@kyle1106)谷歌发布TranslateGemma开放翻译模型系列,手机端可运行,性能超越更大参数量模型 中发帖

谷歌基于Gemma 3架构推出TranslateGemma开放翻译模型系列,共有4B、12B和27B三种参数规模,支持55种核心语言及多模态图像翻译,并已在Kaggle和Hugging Face开放下载。性能测试显示,TranslateGemma 12B版本的翻译质量超越了参数量大其两倍的Gemma 3 27B基线模型,这意味着开发者仅需消耗一半的算力资源即可获得更高保真的翻译结果。同时,体量最小的4B模型性能与12B基线模型相当,为移动端和边缘计算设备提供了强大的翻译能力。技术方面,其高密度智能源于独特的“两阶段微调”工艺:首先是监督微调,利用Gemini模型生成的高质量合成数据与人工翻译数据混合训练;随后引入强化学习阶段,通过先进奖励模型引导生成更自然的译文。此外,新模型完整保留了多模态能力,在文本翻译上的提升直接增强了图像内文字的翻译效果。三种尺寸对应不同部署场景:4B模型专为手机和...