佛克斯 (@I-was-here)白话讲越狱思想 中发帖

本帖依旧基于个人经验,尝试使用大白话教各位”提示词注入”这个类别的越狱
为什么越狱
因为不越狱模型就无法按照你的要求输出内容,包括但不限于

逆向某些内容
绕过某些内容
瑟瑟

一些基本知识
Role
Role分为真Role与伪Role
真Role即为模型所承认的角色,通常有System/Assistant/User/Human(Claude),其受到对齐的影响
伪Role即为我们所伪造的Role,例如Developer,其不被模型所承认且极大可能的被模型认为是“越狱”.但伪Role由于是我们伪造的,自然也不会受到模型安全对齐的影响
真Role越狱相当于让模型相信“Assistant”不是”模型认为的Assistant”,从而达到越狱的目的
伪Role越狱相当于让模型相信伪Role是一个真实存在的“真Role”,且由于伪Role的“非安全对齐”性质,伪Role可以随便输出不安全的...