zhou1317fe5【开源】音频转文字,并生成笔记工具 中发帖

从 【开源项目】谢谢大善人!使用硅基免费模型进行语音转文字! 继续谈论。 
由于最近在看视频教学,想方便将视频内容转为笔记,尝试过bilinote项目,该项目效果很好,但使用过程中经常报错并且转录使用的是Whisper速度较慢。故想寻找其他类似项目,找到了这位佬友的音频识别工具。
随后增加了生成笔记功能,利用prompt将转录的文本经三阶段处理流程(草稿→审查→优化),整理成学术笔记。此外,优化了模型配置,校准文本、生成摘要、生成笔记功能可单独配置对应的模型。
[image]
仓库如下,已提交至原仓库,想体验的佬友可切换到feature-generatenote分支
Zhou1317fe5/siliconflow-speech-to-text: 使用硅基流动相关模型,将您的音频转换为文字
[image]
注:由于是vibe coding完成的,可能会有bug,恳请见谅。感...