Código de erro 429

Se o número de solicitações exceder a capacidade alocada para processar solicitações, o código de erro 429 será retornado. A tabela a seguir mostra a mensagem de erro gerada por cada tipo de framework de cota:

Estrutura de cota Mensagem
Pagamento por utilização Resource exhausted, please try again later.
Capacidade de processamento provisionada Too many requests. Exceeded the Provisioned Throughput.

Com uma assinatura de capacidade de processamento provisionada, é possível reservar uma quantidade de capacidade de processamento para modelos específicos de IA generativa. Se você não tiver uma assinatura do throughput provisionado e os recursos não estiverem disponíveis para o aplicativo, um código de erro 429 será retornado. Mesmo que você não tenha capacidade reservada, tente fazer a solicitação novamente. No entanto, a solicitação não é contabilizada na taxa de erros, conforme descrito no contrato de nível de serviço (SLA).

Para projetos que compraram a capacidade de processamento provisionada, a Vertex AI mede a capacidade de processamento de um projeto e reserva essa quantidade de capacidade para que ela esteja disponível. Quando você usa menos do que o valor de throughput comprado, os erros que poderiam retornar como 429 são retornados como 5XX e são contados como parte da taxa de erros descrita no SLA.

Pagamento por utilização

No framework de cota de pagamento conforme o uso, você tem as seguintes opções para resolver erros 429:

A seguir