JamesTofard写了个音视频转录程序 中发帖

日常生活中经常会遇到需要转录音视频的需求,之前自己用本地部署的 Whisper 模型写过一些小脚本。最近看到硅基流动(SiliconFlow)平台上线了 API 服务,也看到站里佬友分享了类似的小程序,于是心血来潮,花了几个小时自己也搓了一个小应用。 
主要功能

一键转录:支持 mp3, mp4, m4a 等多种主流音视频格式的上传和转录。
AI 驱动:调用硅基流动平台的语音识别和 LLM 大模型,实现转录和智能校正。
Docker 支持:项目已完全容器化,提供了 Dockerfile 和 docker-compose.yml,方便一键构建和部署。

🚀 开源地址
项目已在 GitHub 开源,欢迎大家 Star、Fork、提 Issue 和 PR!



目前项目刚刚实现最小可行化(MVP),后续会持续加班加点添加新功能。如果大家有任何想法或遇到任何问题,随时欢迎交流!