@snbdjxsb 在 Vertex AI Express 调用2.5pro报错429 中发帖
一种原因可能是请求时计算资源不够了(如果rpm小于7),可以去new-api里把失败重试次数调高一点,我调到3后在cherry studio就没遇到429了,不过因为自动重试可能响应慢一点。
另一种原因就是超出配额,我用python测了下并发,超出7就报错”Quota exceeded for quota metric“,“quota_limit_value” : “7”,所以rpm应该最高是7。