dill 在 今天我的 gpt-5.5 不到 40 tokens/s,这合理吗? 中发帖
美国甲骨文,docker 里面部署的 CPA 反代 Codex,本机 axonhub 连接到 CPA。本地 OPENCODE 接 axonhub 用。今天只有 38 tokens/s 的速度。TTFT 看着还比较正常。如图:
[image]
[image]
太慢了,同时跑 3 个项目才烧了 2 亿 tokens,pro 20x 怎么用得完啊。
[image]