nanbloom001感觉 GLM 额度的消耗是随上下文长度几何系数增加 中发帖

佬友们 我是 GLM pro 会员,在 zcode 中使用,感觉额度消耗计算是不是有问题:一开始问了几轮,额度只掉了一点点(5h 掉了 4%),跨度大约 1h 所以应该可以部分排除额度消耗统计有延迟的问题(但是延迟确实挺大),此时上下文一直控制在 4W 左右(可能是任务初期使用子代理比较多,且仓库中文件不多)反正此时额度感觉很耐用,但是最后一轮时,上下文来到了 20W 左右,然后额度一下子掉了 70% 感觉这个计算是不是有点问题,或者说是不是延迟有点太大了(以上均在下午高峰期)。看 codex 的 gpt 额度都是实时变化的