Soupcola【求助】扫描版书籍PDF如何将其内容进行识别并结构化保存起来 中发帖

有没有大佬做过相关的呀?怎么做比较合适呢?直接用多模态大模型识别吗还是有其他方案呢?