arch 在 ORC的新大模型方案-GutenOCR 中发帖
新出的 GutenOCR,基于 Qwen2.5-VL-3B/7B 微调。
专注于提升文档处理能力,特别是增强了定位能力。在文本检测召回率和行级识别精度上都有大幅改进。
需要处理复杂文档版面的推荐看下。
[image]