@JackBlue 在 Google 开源新的300M参数的嵌入模型EmbeddingGemma 中发帖
http://hhuggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
[image]
[image]
EmbeddingGemma 在 MMTEB (多语言,v2) 和 MTEB (英语,v2) 套件上进行了基准测试,这些套件涵盖了广泛的任务、领域和语言。尽管其参数规模仅为 308M,但该模型在保持极小内存占用的同时,持续超越可比的基线模型。
结果将列在官方的 MTEB 排行榜上。我们排除了任何在超过 20%的 MTEB 数据上训练的模型,以减轻潜在的过拟合风险。
EmbeddingGemma 是一个来自谷歌的 308M 参数、在其规模上最先进的开放嵌入模型,基于 Gemma 3 构建(使用 T5Gemma 初始化),并使用了创建 Gemini 模型相同的研究和技...