eureka (@eureka6688)【自部署】TTS文本转语音大模型(docker一键使用) 中发帖

马上国庆节了,写了个小玩具给大伙耍耍。 😁 
众所周知,阿里开源的Cosyvoice文本转语音大模型的效果非常的不错 👍
我也把玩了很久 🫴
但苦于没有高性能的显卡 💪 (租的卡总有一种紧迫感,用得不舒坦 ),所以写了个纯CPU运行的版本 :bili_038:
相较于官方原版:




CPU推理时
原版
精简后




内存占用
4G+
4G+


硬盘占用
20G+
8.93G


速度相同
50s/it
50s/it



对于原版,做了以下处理:

剔除不必要的Python环境依赖和模型文件,硬盘占用减少10G
基于python:3.10-slim镜像(裸镜像仅43M大小),并且使用Docker打包,系统更轻量的同时,不会遇到安装报错、版本不兼容、网络错误等等等等问题,小白也能轻松部署。
重写了WebUI,(原版UI仅供测试使用,并且解决了第一次生成时,无法获取音频的...