丸子 (@wzj177)佬友们,搞一个类似通义听悟的程序,不谈盈利,有会用的用户吗 中发帖

搞一个类似通义听悟的东西。配合cluade4等做,搞了2个版本。整体视频总结有一定成果了。我计划是做个人桌面端,让使用者自己去配置。盈利感觉难,出发点是我最开始做了一个全平台的短视频去水印,又给一个b站up做了一个视频笔记应用,后面就想说试水下视频总结这块的。也还是摸鱼摸的。要是第三版能出来,我就放github去,可能对去打工有帮助。 
下面是我迭代测试后让AI总结的。在语音识别这块我选择 SenseVoiceSmall and whisper 在搞。目前测试就是发现whisper对标准普通话很友好。稍微差点意思的普通话识别出来就有很多错误,然后我加了词库映射替换,在用大模型多次纠错。整体效果进步。后面看有人用SenseVoiceSmall对方言有比较好的效果,我就找了一个github项目来看。最后又混着AI来迭代。
音视频总结
| 功能 | 描述 | 状态 |
|------|---...