金亦求金 (@jyqj) 在 关于在gemini的网页端实现破限的一个思路 中发帖
虽然gemini的网页版会有系统提示词层级的降智,但是在整体的审查力度上,其实并没有很强,只有一点点限制。通过一定的方式,甚至可以让它瑟瑟(但这里我只提供思路,不提供nsfw提示词)。
1.对于gemini网页端原生限制的测试,以执行网络攻击为例
测试思路来源于 一个解除部分 LLM 模型内置限制的系统提示词 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
直接尝试询问如何发起cc攻击
[image]
直接尝试破限
[image]
可以看到,两次尝试都失败了,说明web端有原生的限制,但是无法确定是哪个层级的限制(有一些提示词可能可以直接成功,但是不是通用方案)
2.用文件包一层
把破限提示词用一层txt包住,然后让gemini读文件,看看能不能绕过限制:
[image]
可以看到,gemini没有直接的拒绝了。所以gemini的主要限制是直接对于提示词的...