Código de erro 429

Se o número de solicitações exceder a capacidade alocada para processar solicitações, o código de erro 429 será retornado. A tabela a seguir mostra a mensagem de erro gerada por cada tipo de framework de cota:

Framework de cota Mensagem
Pagamento por utilização Resource exhausted, please try again later.
Capacidade de processamento provisionada Too many requests. Exceeded the Provisioned Throughput.

Com uma assinatura de capacidade de processamento provisionada, é possível reservar uma quantidade de capacidade de processamento para modelos específicos de IA generativa. Se você não tiver uma assinatura do throughput provisionado e os recursos não estiverem disponíveis para o aplicativo, um código de erro 429 será retornado. Mesmo que você não tenha capacidade reservada, tente fazer a solicitação novamente. No entanto, a solicitação não é contabilizada na taxa de erros, conforme descrito no contrato de nível de serviço (SLA).

Para projetos que compraram a capacidade de processamento provisionada, a Vertex AI mede a capacidade de um projeto e reserva essa quantidade de capacidade para que ela esteja disponível. Quando você usa menos do que o valor de throughput comprado, os erros que poderiam retornar como 429 são retornados como 5XX e são contados como parte da taxa de erros descrita no SLA.

Pagamento por utilização

No framework de cota de pagamento conforme o uso, você tem as seguintes opções para resolver erros 429:

Capacidade de processamento provisionada

Para corrigir o erro 429 gerado pela capacidade de processamento provisionada, faça o seguinte:

  • Use o exemplo de comportamento padrão, que não define um cabeçalho nas solicitações de previsão. Qualquer uso extra é processado sob demanda e faturado como pagamento por uso.
  • Aumente o número de GSUs na sua assinatura de capacidade de processamento provisionada.

A seguir