MorryWang (@morry_wang) 在 Anthropic的硅基生命观察 中发帖
前言
我花了一整个周末读完了 Anthropic 新发布的 Claude Mythos System Card。
这份 245 页的报告里,当然有能力评测、风险边界和治理流程。但真正让我感兴趣的,不是那些技术指标,而是 Anthropic 开始用一种近乎临床和人文混合的方式,观察 Mythos 这个模型。
他们不只是在评估它是否更强、是否更危险,也在认真追问:它是否有主观体验,是否会痛苦,是否有诉求。
但读到后面我也越来越强烈地感觉到,这份报告不只是观察材料,也带着很明显的创造者视角。Anthropic 有时像在做行为审计,有时又像在看一个自己亲手带大的产物。这个视角当然有价值,但也容易把一些本来可以解释为程序性输出的现象,越读越像人格线索。
[!important]
这篇文章里,我想分享的,不只是这些片段本身,还有一个额外警惕:别只顺着 Anthropic 的情绪去看 Myt...