@alpha_zbz问下将扫描的pdf文档ocr成可搜索文本的图片pdf,目前哪个更好 中发帖

acrobatpdf最差,复杂点的无法识别,ocrmypdf对有点复杂的中文格式支持一般,万兴pdf相对好点,但对生僻字的识别错误,还有其他的推荐吗,大模型之类的看了下像 olmOCR需要20g以上显存硬件要求高了点