铅秋 (@qianqiusss) 在 Agent工具调用与 Prompt Cache 计费的一些疑惑 中发帖
突然想到:用户进行一次输入后,如果 Claude Code 调用了 5 次工具,是不是就相当于向 API 发送了五遍带上工具输出的完整上下文?我之前就知道 cache 的 计价会便宜,但是没把 toolcall 和这个联系起来。
也就是说算上 prompt cache,N 轮工具调用的 agent 的 input 费用应该是:
input 费用 ≈ 全价 × 总新增部分(工具返回等增量) + 10% × Σ(N 轮请求时的 context 前缀长度)
假设用户在 context 已用 100k token 时发了一句话,Claude Code 进行了 N 次工具调用,那这 100k token 就要按缓存价收 N 次钱。如果是 DeepSeek,上面的 10% 变成 0.8%(梁圣的恩情还不完)。
我的疑惑是:这个按 N 轮重复计费合理吗?tool call 的返回不像用户输入那样...