kejun (@ke_jun) 在 250320 三花AI日报:全新 Halfmoon 在生图竞技场登顶;阶跃星辰推出 Step-Video-TI2V;基于 Llama-3b 架构的TTS系统;加速混元3D生成速度 30 倍;Windsurf 支持类Cursor补全 中发帖
阶跃星辰推出 Step-Video-TI2V:30B 参数图生视频模型
Step-Video-TI2V 是由 StepFun(阶跃星辰)开发的图生视频模型,拥有 30B 参数,是目前开源社区中规模最大的 TI2V 模型之一。
该模型能够根据提示词和初始图生成 540p/24fps 共 5 秒的视频。采用 MIT 许可证完全开源,可以随意商用。
该模型对 GPU 要求较高,单 GPU 运行需要超大显存支持,推理时间较长(约 14 分钟),即使使用 4GPU 也需要大约 5 分钟。
Orpheus TTS:基于 Llama-3b 架构的开源语音合成系统
[图片]
Orpheus TTS 是一个开源的基于 Llama-3b 的 TTS 系统,旨在提供接近人类水平的语音合成质量。具有自然语调、情感表达和高清晰度的特点。
项目基于 Apache 2.0 许可证开源,可以商用。官方的...