隐隐约约 (@yk_chen)跳出对Anthropic的自证陷阱 中发帖

在这次所谓的“蒸馏攻击”事件中,Anthropic自身的合规问题,反而被严重低估了。 
从其公开文件来看,Anthropic 对用户数据的审查和追踪,权限之高、范围之广,已经明显越过了很多人对“AI 安全公司”的想象边界。以下内容并非猜测,而是文件中明确写明的做法:


深度审查用户提示词内容
Anthropic 不只是做风控级别的检测,而是系统性分析用户提示词的“数量、结构和重点”。
他们会审查用户是否试图让 Claude 输出“内心推导步骤”,也会直接查看涉及政治敏感议题的提问(如异议人士、政党领导人、威权主义等)。
更值得注意的是,报告中甚至原样复现了用户反复使用的具体 Prompt 模板。


收集并追踪请求元数据与 IP 地址
通过 IP 关联、请求元数据、基础设施指标,对相关活动进行持续追踪。


监控支付方式与行为模式
包括账户之间是否存在相同使用模式、共享支...