zreal 在 Marker -支持pdf、epub、word等多格式文档转换神器 中发帖
🚀 Marker能做什么?
多格式支持:可以转换PDF、图片、PPT、Word、Excel、HTML、EPUB等多种文件格式
高质量转换:完美保留表格、公式、链接、代码块、参考文献等格式
图片提取:自动提取并保存文档中的图片
去除杂项:自动清理页眉页脚等干扰元素
多种输出:可输出为Markdown、JSON或HTML格式
性能卓越:相对于Llamaparse和Mathpix等类似功能类库,转换速度快、准确率高,可在GPU、CPU甚至MPS上运行,
另外本人也用MinerU,Marker用的更多一点
效果
本人转过很多pdf,包括ocr的pdf,效果非常好
最新版还有“混合模式”,使用 --use_llm 参数,可在 Marker 的基础上使用 LLM (大型语言模型)。这将实现跨页合并表格、处理行内数学公式、正确格式化表格以及从表单中提取值等功能。它可以使用任何 Gemini 或 O...