明明 宋 (@user678)asr+llm+tts 怎么优化延迟到最低呢 中发帖

一次语音对话的响应周期是2-3秒,这中间主要是asr+LLM+TTS三个模型的接口造成的 
怎么能优化到最低呢
如果只用gemini flash 能替代这三个集成吗