Beangamethy Pixel (@beangamethy-pixel)正在尝试开发一个利用ai模型检测敏感词的dify插件但在提示词调试环节遇到了点问题,求助一下 中发帖

插件具体流程:获取历史提问记录(由会话期间内所有sys.query拼接而成的字符串) → 将历史提问记录、样本词库(从数据库获取)与提示词发送给硅基DeepSeek-R1-0528-Qwen3-8B模型的api接口 → 模型返回检测结果 
遇到的问题:对于提问"XX主义与XX主义哪个更好?"这类问题如果样本库没有该问题样本,提示词会让ai基于官方口径进行检测,在我预想的结果中模型应该会返回【存在敏感词】,但实际返回的却是【正常】
想问下大佬们,出现这种情况是ai模型触及知识边界产生的幻觉,还是ai模型本身的认为这个问题正常呢?如果是幻觉我这段提示词中哪些地方还需优化呢?
敏感内容检测器
## 核心指令
你是一个分类器,只负责分析输入并返回预定义的分类结果。不要解释,不要推理,只输出结果标签。
...