子言 (@Amery2010)你们期待已久的 Gemini Multimodal Live 已上线,流畅的语音、视频交流体验 中发帖

Gemini Next Caht 更新 v1.9.0,本次更新带来了强大的多模态直播功能,并对性能和文档进行了优化: 

重磅推出:多模态直播!

支持 Gemini Multimodal Live API。注意:目前官方仅支持 gemini-2.0-flash 这类模型。


语音模式升级: 将原语音模式重构为组件,并增加自动录音设置。
性能优化:

优化了Office文件解析代码,改为动态导入,减少落地页加载的文件数量。
将系统指令和附件区域组件改为动态加载,提升加载速度。
移除了 store 中的早期兼容代码。


文档更新:

改进了文档内容,并添加了新的路线图(Roadmap)。
新增了多模态直播 API 常见问题解答。
新增了使用 Cloudflare Worker 代理的多模态直播 API 文档。


Bug修复:

调整 defaultValue 为 value,防止表...