arch 在 Gemma 4 已出,端侧本地小模型开发者的福音! 中发帖
Google DeepMind 刚刚在 Hugging Face 丢出了 Gemma 4,这波真的有点猛。
核心亮点就三个词, 真开源、全模态、满血生态。
完全的 Apache 2 协议。不仅能看图看视频,2B/4B 的端侧小模型连音频输入都直接包揽了。大参数的 31B 稠密和 26B MoE 跑分都在第一梯队。
今天刚发,transformers、llama.cpp、MLX 和 WebGPU 的支持就已经全部就位。
想在本地或者端侧折腾多模态 Agent 的,上吧!!
🔗 https://huggingface.co/blog/gemma4