n0safe (@p0w1r) 在 佬们,帮忙看看我这个工作流的思路能实现吗 中发帖
想要实现的场景是:
公司目前的内部知识库文档数量已经比较庞大,但是文档格式五花八门(pdf、word、markdown),格式也比较乱,现在想要把这些文档整理一下,统一转换成markdown的标准格式(文档中有大量的图片),然后将这些文档进行分类、归总,有没有什么好的项目之类的能够自动化实现转换和格式化?
格式化完成之后,打算搭建RAG的企业内部知识库问答,目前打算用dify,有没有其他好的建议呀?