FreeMind (@paulcx) 在 Google 发布 Gemini 2.5 技术报告【完整版】【中文版】 中发帖
[图片]
Gemini 2.5 使用了一种稀疏的混合专家(MoE)架构,具备原生多模态能力。其多样化的预训练数据集包括网络文档、代码和媒体,知识截止到 2025 年 1 月,并采用了改进的数据质量方法。 [图片]
Gemini 2.5 的一个关键进步是“思考”功能,使模型在推理时能使用更多计算资源。这提升了各个领域的推理能力,显著提高了数学和编程技能。AIME 2025 分数从 2.0 版的 29.7% 跃升到 2.5 版的 72.0%。 [图片]
Gemini 2.5 扩展了视频理解,现在可以处理长达 3 小时的视频内容。这得益于改进的视听和时间理解能力,解锁了新的互动应用。2.5 Pro 从 46 分钟的视频中准确回忆了一秒钟的事件。
[图片]
模型的代理能力在“Gemini Plays Pokémon”实验中得到了展示。Gemini 在 800 多小时内...