@snbdjxsb 在 Vertex AI Express 调用2.5pro报错429 中发帖一种原因可能是请求时计算资源不够了（如果rpm小于7），可以去new-api里把失败重试次数调高一点，我调到3后在cherry studio就没遇到429了，不过因为自动重试可能响应慢一点

@snbdjxsb 在 Vertex AI Express 调用2.5pro报错429 中发帖

一种原因可能是请求时计算资源不够了（如果rpm小于7），可以去new-api里把失败重试次数调高一点，我调到3后在cherry studio就没遇到429了，不过因为自动重试可能响应慢一点。 
另一种原因就是超出配额，我用python测了下并发，超出7就报错”Quota exceeded for quota metric“，“quota_limit_value” : “7”,所以rpm应该最高是7。