任意 (@renyi) 在 gemini的原生多模态 vs OCR 哪个对于理解文档更好？中发帖最近要处理长文档，一个文档大概有100页，有的20页，要AI提取文档总结内容我是先使用minerU OCR，还是直接用gemini呢？有没有佬对比过二者的性能差距，我大致测试了一下，好像没有太明显的区别，不知道是不是我的错觉

任意 (@renyi) 在 gemini的原生多模态 vs OCR 哪个对于理解文档更好？中发帖

最近要处理长文档，一个文档大概有100页，有的20页，要AI提取文档总结内容 
我是先使用minerU OCR，还是直接用gemini呢？ 
有没有佬对比过二者的性能差距，我大致测试了一下，好像没有太明显的区别，不知道是不是我的错觉。