demo (@_M0M0) 在分享一个我用 Gemini 搓的notebooklm播客音轨分离脚本中发帖各位佬友们，相信大家最近都体验了 Google 的 NotebookLM，尤其是最近更新的中文语音播客，效果确实惊艳（还没试过的朋友们，强烈推荐）不过，NotebookLM 生成的播客音频是将所有说话人的声音混合在单轨里的

demo (@_M0M0) 在分享一个我用 Gemini 搓的notebooklm播客音轨分离脚本中发帖

各位佬友们，相信大家最近都体验了 Google 的 NotebookLM，尤其是最近更新的中文语音播客，效果确实惊艳（还没试过的朋友们，强烈推荐） 
不过，NotebookLM 生成的播客音频是将所有说话人的声音混合在单轨里的。这对于想进一步编辑，比如制作带说话人区分的字幕、视频，或者进行波形频谱展示等操作来说，就不太方便了。如果能将不同说话人的声音分离开，就能极大地提升后续内容创作（如视频、推文）的效率和质量。 
我找了一圈，没发现特别趁手的工具。于是，灵机一动，干脆让 Gemini 2.5 帮我写了一个 Python 脚本来解决这个问题！ 
隆重推出：Podcast-Speaker-Separator 
👉 GitHub 地址： https://github.com/Magnoliar/Podcast-Speaker-Separator 
💡 主要功能一览 

🎙 自动检测与分离：智能...