GUOSHIYIN (@GUOSHIYING) 在 HeyGem:基于 FastAPI + React 的 AI 数字人视频生成平台技术解析 中发帖
HeyGem:基于 FastAPI + React 的 AI 数字人视频生成平台技术解析
HeyGem 是一套基于 生成式 AI 与深度学习推理服务 的数字人视频创作平台,提供语音克隆、数字人驱动、文本生成口播视频等能力。平台采用前后端分离架构,并可通过 Docker 完整部署,适合内容创作者、教育行业与企业自建 AI 视频平台。
开源地址:GitHub - kele-tao/HeyGemWeb: 一个基于HeyGem接口开发的ai数字人web应用
一、系统整体架构
平台由三部分组成:
1. Web 后端(FastAPI)
提供 RESTful API
调度语音克隆 / 视频生成任务
基于 asyncio.Queue 实现任务排队与串行处理
使用 JSON 文件持久化模型与生成记录
2. AI 推理服务(Docker)
服务
功能
端口
Fish-Speech TT...