for_the_zero (@for-the-zero) 在 关于Gemini Live API的开发 中发帖
最近想那这个api用Python做点东西
需要实时输入麦克风和屏幕,实时输出返回的语音
结果开干之后先做一下麦克风的部分吧,发现文档不是很清晰,问一下ai结果ai也不太会写,啥模型都试了,有的连api都不知道
一下子又不好找到合适的示例代码,找到了几个示例代码结果发现这些代码放我本地都跑不起来,甚至有的提示功能已弃用
Gemini 2.5 Pro,Claude 4.5 Sonnet,GLM 4.6,Deepseek V3. 2,Kimi K2 0905
都试过了,kimi最好,写出一个能发送能接收一次的,但是不能第二轮对话而且体验也有很多问题
我没辙了,不知道怎么办了