任意 (@renyi) 在 gemini的原生多模态 vs OCR 哪个对于理解文档更好? 中发帖
最近要处理长文档,一个文档大概有100页,有的20页,要AI提取文档总结内容
我是先使用minerU OCR,还是直接用gemini呢?
有没有佬对比过二者的性能差距,我大致测试了一下,好像没有太明显的区别,不知道是不是我的错觉。