BinaryChia文档接入AI根据模版规则进行格式化标准化遇到点麻烦,菜狗求思路 中发帖

事情是这样,客户呢要求做一个文档格式智能化的处理: 

能识别各种模版规则
根据模版规则校验用户上传的文档
能够修复不规范的文档内容

我这系统呢用的vue+java+python,AI相关的服务都在python,调的阿里的api,其他处理都在java。
我实现这个是思路是:

多模态模型识别模版规则
用户上传文档之后java先利用poi获取节点坐标,格式和数据,但是问题呢是用户肯定会上传一些奇奇怪怪的文档格式,比如正文加粗当标题,空格代替缩进这种。因此这里我一次prompt识别文本角色,到底应该是标题还是啥角色
识别之后拿着java传的格式对照规则看看符不符合要求
让用户看看检测出来的对不对,勾选一下想修复的,生成修复方案之后开始java-poi修复(修复规则是AI生成的)

整体是这样,问题就在于,检测角色总是不够准,导致有的问题检测不出来,或者检测出来了但是AI对照规则给不出方案...