He (@nukedolby) 在 目前在做知识库,需要对复杂的PDF文档进行解析,目前有什么好的思路和工具吗 中发帖
原本使用的FastGPT的文档切分,但是遇到复杂的PDF文档(比如PPT转成PDF)效果就很不好。佬友们有什么比较好的解决思路么。今天刚看到一个 OCRFlux模型,据说对PDF有优化,目前还在测试效果(似乎容易陷入死循环?)