Megasoft (@zhong_little)gemini-2.0-flash-live-001 上线了 中发帖

今天查看模型列表的时候发现 gemini live api 上线了 
[image]
官网介绍

Live API 支持与 Gemini 建立低延迟的双向语音和视频互动。借助 Live API,您可以为最终用户提供自然的、类似人类的语音对话体验,并能够使用语音指令中断模型的回答。该模型可以处理文本、音频和视频输入,并提供文本和音频输出。


最近发布的模型真是应接不暇,多模态 AI 也越来越近了
[image]