JuniverseCoder 在 [开源] 手搓了个小工具,解决 NotebookLM 生成的 PPT 没法编辑的问题 中发帖
最近在玩 NotebookLM,有一说一,它生成的 Slide 确实好看,逻辑也不错。但用久了发现有两个痛点实在忍不了:
格式是 PDF:完全不可编辑,想改个字都不行。
字体问题:生成中文内容时,字体经常很奇怪,看着难受。
找了一圈市面上的 PDF 转 PPT 工具,要么收费要么转换效果不顺手。
🛠 解决思路 最近正好发现 MinerU 这个项目,它解析 PDF 的时候不仅能识别元素,还带上了精确的坐标信息。 于是我就参考它的解析结果,写了这个 MinerU2PPT。
✨ 实现细节
非 OCR 方案:为了保持效率和排版,我没用 OCR。
样式还原:字体颜色和大小是根据背景颜色自动推断的。
效果:实测下来准确率还行,能满足我绝大部分需求(对于背景特别混乱或者复杂混排的场景,可能处理得还不够完美)。
虽然初衷是为了解决 NotebookLM 的痛点,但理论上别的 PDF 也能转...