今晚打老虎 (@user258) 在 PDF或者word文档解析 中发帖
大佬们,现在有个恶心的需求,就是PDF或者word文档解析,就是需求能完整解析一本书pdf格式的或者word格式都行的,能获取到里面所有的内容以及样式的,包括页面页脚、封面、目录、行注释、封面、图片等所有元素的!有没有技术大佬指点一下哈!目前也有orc,但是识别的效果不是很好!求指点解决方案或者实现方向都可以!