kejun (@ke_jun) 在 250605 三花AI日报:OpenAudio S1:支持多语言情感控制的专业级 TTS 模型;LumaAI 发布 Modify Video:一键重塑视频风格与内容;Stability AI 发布 Virtual Camera v1.1:单图生成运镜视频 中发帖
今天没啥内容,补一条,openai 上线 o3-pro
OpenAudio S1:支持多语言情感控制的专业级 TTS 模型
OpenAudio S1 是由 OpenAudio 团队开发的文本转语音(TTS)模型,它能像专业配音演员一样生成语音。
该模型支持丰富的情感和语气精细控制,涵盖英语、中文、日语、德语、法语等多种语言。价格非常良心,仅为每百万字节 15 美元(约合每小时 0.8 美元)。
佬们可以在官方博客查看技术报告,或者在FishAudio上直接在线体验。
三花的小视频宝也支持这个模型!
LumaAI 发布 Modify Video:一键重塑视频风格与内容
LumaAI 发布 Modify Video 功能,从官方演示视频来看,效果非常的好。
该功能能够智能重塑视频中的风格设定、角色形象和场景布局。
完整介绍可以看官方博客
Stability AI 发...