@thecxy 在 这是cursor按次计费提前绝版了吗 中发帖
随着前沿智能体模型能力持续提升,它们的运行时长更久、所需上下文窗口更大,也会消耗更多 token。
为支持这些能力,最新的前沿模型将从 2026 年 3 月 16 日 起纳入 Max Mode。在 Max Mode 下,系统会根据消息实际使用的 token 数量换算为请求次数。这意味着,单次交互所消耗的请求数会随着任务复杂度而变化。
纳入 Max Mode 的前沿模型
上周,我们发布了 GPT 5.4,这是首个采用 Max Mode 的模型。自 2026 年 3 月 16 日 起,以下模型也将纳入 Max Mode:
GPT 5.3 Codex 和 GPT 5.4
Opus 4.5 和 4.6
Sonnet 4.5 和 4.6
其他所有模型均不受影响,并将继续按照当前规则消耗请求次数。
你需要了解的事项
首次使用 Max Mode 的用户会看到一个弹窗,用于确认所选模式。除...