Carlxlxgemini的实时语音和视频已经上线 中发帖

试用了一段时间,发现他还是有一些问题的 

他的语音并不是像OpenAI的那种实时语音,他在说话的中途你打断不了他,某种意义上还是最原始的语音助手形式,形式上也是类似于对话,你发一句他发一句。不过全程不需要你暂停或者跟微信语音那样按键,他会自动识别你什么时候说话
他的语音识别挺准的,并且相应速度很快,得益于Gemini采用全过程语音输入输出,不需要像传统语音助手那样中间再给你转个文字
目前不支持中文输出,无论我怎么跟他说,打死他也不跟我说中文。目前他跟我说过英文和日文,而且在你跟他强调要用中文沟通之后很大概率用日文回你。难道说谷歌团队觉得东亚这块离日本近,所以就都听得懂日语吗?
你不想听他说日语或者英语,可以切换成文字输出。这回就能输出中文了
支持视频功能,包括你的摄像头还有共享屏幕。我试了试,还是挺准的,可能是调用了2.0 flash的图像识别
目前完全免费,用了二十来分钟也不带停的,不...