Jeff Dean (@Xsc15926) 在 Gemma 4 QAT 模型已发布 中发帖
使用量化感知训练,在保证模型质量的同时降低了显存需求(Q4_0和Mobile)
[paste_1780678295193.jpg]
下载模型文件
使用量化感知训练,在保证模型质量的同时降低了显存需求(Q4_0和Mobile)
[paste_1780678295193.jpg]
下载模型文件