Yez.ai (@Yez) 在 【瞎折腾】自建免费PDF转Markdown工具 中发帖
之前测试Gemini2.0正式版的多模态能力,尝试了文档转录的demo
最近利用业余时间在demo的基础上做了一些代码和提示词优化,同时撸了一个简易的前端页面,自己测试了一些特殊的PDF文档(多栏/公式/表格等),准确度都还比较理想,同时添加了一个基础的双语对照翻译功能
实现思路大概是利用工具切分PDF,然后直接将文档丢给大模型进行初步处理,处理完成后,对返回数据基于正则等相关内容进行二次处理
由于用了gemini2.0模型,所以对用量基于授权码做了一下限制,每个授权码至多转录100页
有需要的佬欢迎试用,目前图片插入原文位置的坑还没填,但已经有实现思路,后续如果有时间会来填坑,同时会增加自定义大模型key
临时折腾的小玩意,希望大家多提意见和建议
站点地址:pdf2md.aitranspdf.com(纯公益,无推广性质,上传的文档数据2小时后过期)
希望佬友们善意使用,如果...