Si la cantidad de solicitudes supera la capacidad asignada para procesar solicitudes, se muestra el código de error 429
. En la siguiente tabla, se muestra el mensaje de error que genera cada tipo de framework de cuota:
Marco de trabajo de cuotas | Mensaje |
---|---|
Pago por uso | Resource exhausted, please try again later. |
Capacidad de procesamiento aprovisionada | Too many requests. Exceeded the Provisioned Throughput. |
Con una suscripción de capacidad de procesamiento aprovisionada, puedes reservar una cantidad de capacidad de procesamiento para modelos de IA generativa específicos. Si no tienes una suscripción a la capacidad de procesamiento aprovisionada y los recursos no están disponibles para tu aplicación, se muestra un código de error 429
. Aunque no tengas capacidad reservada, puedes volver a enviar la solicitud. Sin embargo, la solicitud no se toma en cuenta en la tasa de error, como se describe en el Acuerdo de Nivel de Servicio (ANS).
En el caso de los proyectos que compraron el rendimiento aprovisionado, Vertex AI mide el rendimiento de un proyecto y reserva esa cantidad de rendimiento para que esté disponible. Cuando usas menos del importe de rendimiento comprado, los errores que, de otro modo, se mostrarían como 429
se muestran como 5XX
y se registran como parte del porcentaje de errores que se describe en el ANS.
Pago por uso
En el framework de cuota de prepago, tienes las siguientes opciones para resolver los errores 429
:
- Implementa una estrategia de reintento con la retirada exponencial truncada.
- Si configuraste una anulación del consumidor y la configuraste para controlar el costo, aumenta el límite. Para obtener más información, consulta Cuota compartida dinámica.
- Suscríbete a la capacidad de procesamiento aprovisionada para obtener un nivel de servicio más coherente. Para obtener más información, consulta Capacidad de procesamiento aprovisionada.
¿Qué sigue?
- Para obtener más información sobre la cuota compartida dinámica, consulta Cuota compartida dinámica.
- Para obtener información sobre las cuotas y los límites de Vertex AI, consulta Cuotas y límites de Vertex AI.
- Para obtener más información sobre las cuotas y los límites de Google Cloud, consulta Obtén información sobre los valores de cuota y los límites del sistema.