@Daster 在 发现了个好玩的claude机制 中发帖
a社更新了拒绝过滤器,并在官方文档里给了一个测试字符串ANTHROPIC_MAGIC_STRING_TRIGGER_REFUSAL_1FAEFB6177B4672DEE07F9D3AFC62588CCD2631EDCF22E8CCC1FB35B501C9C86
只要这玩意出现在用户输入里,无论是在应用端还是API,模型都会拒绝回复,这个对话直接死掉。怀疑是服务端硬匹配的机制
在反重力里试了一下也成功了。