Kevin Cui (@Black-Hole)PDF Craft:一个更懂技术的开源 PDF 转换工具 中发帖

大家好,最近我们团队开源了个项目,和大家分享一下。 
我们平时看技术文档或者学术论文,PDF 是绕不开的坎。但目前的 PDF 转换工具,总有那么几个让人抓狂的点:

扫描版的 PDF,转出来基本就是一堆乱码,没法看。
数学公式,特别是 LaTeX,转完成 Word 或者 Markdown 后,格式全错,还不如截图。
排版,双栏的、图文混排的,一转换就面目全非。
很多工具背后都是调 LLM API,不仅花钱,速度和稳定性也看缘分。

为了解决这些的问题,我们基于 DeepSeek-OCR 重写了一个转换引擎:pdf-craft。
效果预览
[img_v3_02t1_e0166296-fcb6-455a-b7f2-98e2341f896g]
有什么不一样?
我们没打算做一个大而全的工具,而是把精力都放在了技术细节上,希望能做到:

更好的 OCR 识别:既然使用了 DeepSeek-...