Chase (@abc5z7) 在目前是否有本地部署的实时流式返回音频的语音大模型中发帖想要在本地部署一个能语音对话的服务，需要一个能流式返回音频的语音大模型

Chase (@abc5z7) 在目前是否有本地部署的实时流式返回音频的语音大模型中发帖

想要在本地部署一个能语音对话的服务，需要一个能流式返回音频的语音大模型。 
我目前试了qwen2.5-omni，使用官方代码transformers部署，无法实现流式返回音频，且官方文档也说明了如果使用vllm部署只能返回文字流。（如果有佬友知道怎么流式返回音频，请给个网址或仓库学习学习） 
百炼平台目前api的形式是支持流式返回音频，但我的需求是本地部署。 
或者有没有其他语音大模型，支持流式返回音频的。