xiuwen# OpenClaw + Anthropic 兼容代理缓存不命中实战:从高成本到稳定 Cache Hit 中发帖

问题背景
在 OpenClaw 通过第三方 Anthropic 兼容代理调用 Claude Sonnet 4.5 时,我们遇到一个非常典型的问题:

单次请求 Input Tokens 约 46K
Prompt Caching 长期不命中(Cache Read = 0, Cache Write = 0)
单次成本约 $0.035,会话越长越贵

看起来已经启用了缓存,但账单侧完全没有收益。
根因分析
排查请求结构后发现,底层 Anthropic provider 已经发送了 cache_control: { type: “ephemeral” },缓存标记并不缺失。
真正的问题在代理层路由:

Prompt cache 按 organization/key 命名空间隔离。
多后端负载均衡下,如果没有稳定的 metadata.user_id,连续请求可能落到不同后端。
后端不一致意味...