管理员 (@Omnis) 在 关于中转站提示词注入 中发帖
最近在论坛,中转站提示词注入的话题一直居高不下
😅 其实是因为由于缺LDC了,发个文章骗点红心
方便的话在文章末尾点个 ❤ 谢谢惹
因此本文通过部分方式对系统提示词注入的站点进行了分析
😭玩老虎机破产了,只能去分析这个了
本文仅对提示词技术做分析,不针对对任何站点
正常情况下,一般提示词注入可以通过论文 arXiv 2604.08407 中通过 prompt_tokens 膨胀数量来计算检测,这个也是目前常见检测手段方式
但是在之前常见的中转站中,并不会将另外注入的prompt_tokens 膨胀数量进行调整,导致很容易被识别
[image]
但是本次测试后发现目标中转站有对此测试做另外的优化
在日常测试中,claude 通过自检的方式发现问题( 😊 阿莫迪老哥)
[image]
在这里 Claude已经发现了,除了最初自带了一部分Kiro的提示词
...