古德蕉 (@s0nder)如何构造prompt让大模型分析网页数据并给出符合业务的解析流程? 中发帖

背景
各位佬,大家好,小弟当前有一套对HTML DOC进行字段解析的代码,传入是一个JSON字符串,表示对某个字段的解析流程,该流程里预设了用代码写好的解析算子,比如用css、xpath、jsonpath、正则解析的算子,比如我需要对网页中的title字段解析,那么我传入的JSON字符串会是这样的
{"field":"title","pipeline":css算子及对应算子的参数,xpath算子及对应算子的参数,...}

注:JSON的结构比例子中的要复杂的多,是多层嵌套的


对于单一的网页,我需要设计一套提示词A去让大模型给出以上代表流程的JSON字符串,然后我直接作为入参传入我的解析函数里即可对该网页(以及与该网页相似的网页)进行解析


对于整个网站,我需要设计一套提示词B去让大模型把以上所有可用于解析单一网页的所有流程再重新组合成一个通用的解析流程(一个通用的JSON字符...