demo (@_M0M0) 在 分享一个我用 Gemini 搓的notebooklm播客音轨分离脚本 中发帖
各位佬友们,相信大家最近都体验了 Google 的 NotebookLM,尤其是最近更新的中文语音播客,效果确实惊艳(还没试过的朋友们,强烈推荐)
不过,NotebookLM 生成的播客音频是将所有说话人的声音混合在单轨里的。这对于想进一步编辑,比如制作带说话人区分的字幕、视频,或者进行波形频谱展示等操作来说,就不太方便了。如果能将不同说话人的声音分离开,就能极大地提升后续内容创作(如视频、推文)的效率和质量。
我找了一圈,没发现特别趁手的工具。于是,灵机一动,干脆让 Gemini 2.5 帮我写了一个 Python 脚本来解决这个问题!
隆重推出:Podcast-Speaker-Separator
👉 GitHub 地址: https://github.com/Magnoliar/Podcast-Speaker-Separator
💡 主要功能一览
🎙 自动检测与分离:智能...