fj6518现在除了gemini还有支持音频输入的多模态大模型吗? 中发帖

好像4o和claude都只支持图片,我想做音频翻译,是不是只能选择gemini了