yhp666微软刚刚开源的VibeVoice 中发帖

微软昨天发布了最新的开源TTS模型VibeVoice 
今天下班早找个测试机搭了个环境,分享给L站里有需要的佬们。
1、物理机配置:i7-13700KF,DDR5 128G,Nvidia-3090(24G显存)
2、操作系统:Ubuntu 22.04.5 LTS
3、推理环境:Python 3.10.18
4、模型地址:WestZhang/VibeVoice-Large-pt · Hugging Face
5、目录结构:
(vibevoice) root@dev-3090:/workspace/VibeVoice# tree
.
├── demo
│ ├── example
│ │ ├── 1p_EN2CH.mp4
│ │ ├── 2p_see_u_again.mp4
│ │ └── 4p_climate_45min.mp4
│ ├── grad...