白菜工厂1145号员工 (@baicai1145)昨晚openai的实时语音对话模型发布会直播回放熟肉 中发帖

几乎没啥更新,在应用层整了点活,创新点就是语音mcp,还有SIP可以搞webrtc。音质还是那么差,而且有个左右脑互搏的点,发布会说这次的gpt-realtime是首创的s2s端到端模型,但是一年前的4o就已经这么说了 :tieba_008: 难道之前的4o实际是asr+llm+tts