rogertatdify+deepseek r3对不定格式表格转换为段落格式,总是丢失输出细节怎么解决? 中发帖

目前使用Dify文档提取器,将表格转化为MARKDOWN然后通过deepseek v3转换为markdown段落,便于后续的工作流进行分析和输出,换句话说,就是把excel改成纯文字描述。 
但是经常发现模型喜欢不由自主地进行改写
例如,某个表头为“支持展示的指标”,内容为“温度、湿度、高度、宽度”
最终AI生成的数据会是:支持展示温度、湿度等指标
在prompt中,已经指出了“不要自主改写、省略指标,需要保持原样”,但是似乎指令遵循一般,都会进行改写
测试了几个不同的模型,包括r1(r1是个别情况会这样)、qwen72b,llama70b都不行,我认为,可能走提示词不是最佳路径
那么可否通过其他方式来改进这一点?
曾经尝试过先用openpyxl解析清洗一波。然而拿到的几个文档,表格的格式,表头、合并单元格、sheet页都有很大的随机性,甚至可能一个表格会拆成一个sheet中多...