raye请问下有没有OCR识别结果合并的方案 中发帖

OCR识别的结果比较零散。有没有合并的方案。 

段落合并,把相同的段落合并到一个框内。
同行合并。

目前只能想到的是根据坐标的阈值来合并。但是因为识别的图片相差太大。这个阈值不是很好控制。而且无法解决段落合并的问题。因为相邻的两行可能不是一段。
大家有没有什么好的思路,或者有没有相关的项目。