Doc2X(PDF翻译公式识别) (@circle-cc) 在 千页pdf公式表格精准解析,轻松构建知识库 中发帖
前言
市面上有不少的pdf解析工具,但是要么效果不够好,要么价格太昂贵
给各位佬自荐下我们开发的pdf解析工具Doc2X
效果够好(复杂布局,公式,表格都能handle),价格也足够便宜(网页0.01元/页,API 0.02元/页),
相比mathpix的 0.02美刀/页 textin 的0.05元/页 腾讯云的0.1元/页等还是便宜很多
效果展示
旋转表格识别:
[screenshot-20250123-115550]
公式识别效果:
[screenshot-20250123-115732]
使用方法
API 调用
api需要在 Doc2X开放平台 注册使用
调用也很简单,我们提供了pip包 pdfdeal 轻松安装调用
pip 安装:
[screenshot-20250123-120127]
也有文档提供使用
此外还可以使用我们的开源项目在Doc2X解析...