@AoManoh 在 头脑风暴,佬友们,我想搭建一个开源的转录视频音频为中文的项目,有什么建议吗? 中发帖
是这样的,鼠鼠我呀,想要捞一点开源经历(虽然已经开源了一个烂大街的面试官项目了),也增加一点自己 AIGC 的能力。所以想要做一个能够将一个外语播客,转换成中文播客的功能。全程用 AI 进行开发。
需求是这样的:一段播客视频文件,上传后解析,解析后将视频原声对话替换为中文对话。并且对话要尽可能保证声情并茂,感情线啥的要到位
比如,一个时间片内,发生了如下对话:
A: hello, how old you?
B: I'm fine thank you!
-> 替换后
A:你好,你多大了?
B:我很好,谢谢!
求建议:佬友们有什么推荐的方案或者可参考的项目呢?
当前困境:我该如何去学习应用呢?现在还在让 AI 帮我梳理需求,搭建架构的环节。
鼠鼠技术背景:go 后端开发的,打算转 AIGC 全栈开发了,春招再找不到,鼠鼠就只能去拧螺丝了 😭