多吉是只伯恩山 (@pili) 在 求大佬们给一份提示词,关于防止敏感内容输出的 中发帖
是这样的,我自己有个AI站点,目前模型是gpt和克劳德这种国外模型为主。
所以必须是要做一层敏感词过滤,不然后果大家都懂的。
目前我的敏感词过滤是接入的是百度敏感词,但是这个并不能完全阻止别人🎣。
比如gpt模型多数为多模态,换成图片或者文档的形式,完全可以绕过百度敏感词检测。
还有一种办法是输出内容做一层过滤,但是条件有限,我自己又做不了这个。
所以求助下论坛大佬,有没有好用一点的提示词。
我将提示词内置到我的系统,防止gpt输出这种敏感内容,但是又不会很严重影响用户的体验。
大佬们如果有好的提示词,分享给我下呀!