kejun (@ke_jun) 在 250306 三花 AI 日报:谛韵: 开源音乐生成模型;谷歌搜索推出 AI Mode 测试版; 阿里开源 QwQ-32B;AI 驱动的数学与科学教学动画;LTX-Video 0.9.5:开源可商用视频生成模型;ComfyUI-Pruna:无损加速 SD 和 Flux 模型推理; 中发帖
DiffRhythm 谛韵: 开源音乐生成模型
DiffRhythm,中文名谛韵,是由西北工业大学音频、语音与语言处理研究组(ASLP Lab)开发的一种 AI 音乐生成模型。
作为全球首个基于潜在扩散技术(Latent Diffusion)的端到端完整歌曲生成模型,DiffRhythm 只需要 8GB VRAM 就能在 10 到 12 秒内生成一首完整歌曲,目前仅支持中英文。
DiffRhythm 能够一次性生成包含人声和伴奏的完整歌曲,就像 Suno 和 Udio 一样,最长能生成 4 分 45 秒的完整歌曲。
最关键的是,DiffRhythm 完全开源,佬们可以在HF上在线体验玩玩看
TheoremExplainAgent:AI 驱动的数学与科学教学动画
TheoremExplainAgent(简称 TEA)是由 TIGER AI Lab 开发的一款 AI 多智能体,...