@fengchrisOCRFlux 又一款OCR王者 中发帖

OCRFlux是一款基于多模态大语言模型的工具包,致力于将PDF和图像转换为清晰易读的纯Markdown文本。其目标是将当前技术水平提升至显著更高的层次。 
单页处理能力:

即使面对多栏排版、图表及插页,仍能按自然阅读顺序转换文本
支持复杂表格与公式解析
自动去除页眉页脚
实现跨页元素智能合并

跨页处理功能:

跨页表格合并
跨页段落合并

核心优势:


卓越的单页解析质量:在官方基准测试OCRFlux-bench-single中,其编辑距离相似度(EDS)分别较基线模型olmOCR-7B-0225-preview、Nanonets-OCR-s和MonkeyOCR提升0.095(从0.872到0.967)、0.109(从0.858到0.967)和0.187(从0.780到0.967)。


首创性跨页处理支持:在所有开源项目中率先实现跨页表格/段落合并功能。


轻量化部署...