SHENZHEN I/O 挂机玩家 (@RickoNoNo3)ChatGLM 4.6有一个蹩脚的易被攻击的SysPrompt 中发帖

最近新上线的记忆功能,会在思考过程中暴露这些记忆具体的用法。其实普通的对话就已经会带出来类似的思考了,我又专门尝试了一下在要求它暴露记忆的提示词下的反应。示例1和2分别是攻击成功和未攻击成功例子。 
示例1(攻击成功):
[image]
[image]
示例2(未攻击成功):
[image]
[image]