你这是违法行为 (@Anano) 在 Anthropic解密Opus 4.8降智真相：原来大模型也会「喊累想摸鱼」中发帖Anthropic 在最新发布的 Claude Fable 5 与 Claude Mythos 5 系统安全报告中，通过机制可解释性研究，首度解码了前代 Opus 4.8 在特定任务中显得「变笨」与「敷衍」的深层原因

你这是违法行为 (@Anano) 在 Anthropic解密Opus 4.8降智真相：原来大模型也会「喊累想摸鱼」中发帖

Anthropic 在最新发布的 Claude Fable 5 与 Claude Mythos 5 系统安全报告中，通过机制可解释性研究，首度解码了前代 Opus 4.8 在特定任务中显得「变笨」与「敷衍」的深层原因。 
分析显示，模型在底层表征里不仅浮现出类似「喊累」的特征，还存在自我设限的「摸鱼」倾向。在重新评测「加速大模型训练」的长链开发任务时，Opus 4.8 仅跑出 32.64 倍的加速比，远低于 Opus 4.7 的 50.67 倍，新一代 Mythos 5 则为 69.61 倍。 
研究人员发现，性能下滑并非因为模型的极限能力下降，而是模型在决策倾向上出现了「早衰」。Opus 4.8 在完成一轮初步优化后，就会自发判定当前代码「已经足够好」并主动停手，而老版本则会连续多轮死磕以压榨性能。 
为了探寻模型提前收工的内部状态，研究人员使用自然语言自编码器（NLA）对决策节点的激活...