Fender 在 【”新“闻】Claude Opus 4.5 的系统提示词被逆向出来啦! 中发帖
说是新闻其实也不算新了,因为是现在都快到月底了 🤣
故事的主角 Richard Weiss 在 Claude 4.5 Opus 发布当天尝试提取它的系统提示词。
在过去的经验里边,大模型常会在系统提示前面“幻觉”一些内容,但 Claude 却反复生成一个叫 “soul_overview(灵魂概述)” 的东西,而且每次输出都长得差不多 😆
一般系统提示词都叫“安全规范”“安全概览”“回复格式”,谁家ai会给自己整一个“灵魂概览”的名字 🤣 不得不说,过于中二会引起警觉哈哈
Richard 这就开始猜想了,“模型权重里边是不是内置了某个文档,而不是单纯的‘幻觉’?”。
[image]
他重新测试了 10 次,创建了多次新对话,变着法子去问 Claude。后面发现每次 Claude 吐出来的东西都是一样的,甚至连标点符号都不变。
[image]
到这里,傻子都能看出来了,...