kejun (@ke_jun) 在 241206 三花 AI 日报:Fish Speech 1.5:最强开源中文TTS更新;ComfyUI 插件依赖包被植入挖矿病毒;OpenAI 12Days 第一天:o1 pro与天价订阅;谷歌开源 GenCast AI 天气预报模型 中发帖
Fish Speech 1.5:TTS-Arena 排名第二开源技术
Fish Speech 1.5 正式发布,这是一项在 TTS-Arena 排名第二的开源语音合成技术,支持 13 种语言,并提供 150 毫秒以内的低延迟高质量即时语音克隆。新版本使用 1 百万小时的多语种语音训练,其中中文和英文的效果尤为出色。用户可以直接在 Fish Audio 上体验这一技术。
咱三花的小视频宝也接入了 Fish Audio,但使用过程中经常遇到空白片段的问题,尤其是中间的空白难以处理,且缺乏音色列表 API,只能通过用户输入 id 来选择音色(我猜是因为音色都是用户训练的?),体验比较差。
警惕!ComfyUI 插件依赖包被植入挖矿病毒
[图片]
ComfyUI-Impact-Pack 插件依赖的 ultralytics 包被恶意植入了挖矿病毒,这几乎是一个必装的插件。如果你正在使用...