JamesTofard 在写了个音视频转录程序中发帖日常生活中经常会遇到需要转录音视频的需求，之前自己用本地部署的 Whisper 模型写过一些小脚本

JamesTofard 在写了个音视频转录程序中发帖

日常生活中经常会遇到需要转录音视频的需求，之前自己用本地部署的 Whisper 模型写过一些小脚本。最近看到硅基流动（SiliconFlow）平台上线了 API 服务，也看到站里佬友分享了类似的小程序，于是心血来潮，花了几个小时自己也搓了一个小应用。 
✨ 主要功能

一键转录：支持 mp3, mp4, m4a 等多种主流音视频格式的上传和转录。
AI 驱动：调用硅基流动平台的语音识别和 LLM 大模型，实现转录和智能校正。
Docker 支持：项目已完全容器化，提供了 Dockerfile 和 docker-compose.yml，方便一键构建和部署。

🚀 开源地址
项目已在 GitHub 开源，欢迎大家 Star、Fork、提 Issue 和 PR！ 



目前项目刚刚实现最小可行化（MVP），后续会持续加班加点添加新功能。如果大家有任何想法或遇到任何问题，随时欢迎交流！