Se o número de solicitações exceder a capacidade alocada para processar
solicitações, o código de erro 429
será retornado. A tabela a seguir mostra a
mensagem de erro gerada por cada tipo de framework de cota:
Estrutura de cota | Mensagem |
---|---|
Pagamento por utilização | Resource exhausted, please try again later. |
Capacidade de processamento provisionada | Too many requests. Exceeded the Provisioned Throughput. |
Com uma assinatura de capacidade de processamento provisionada, é possível reservar uma
quantidade de capacidade de processamento para modelos específicos de IA generativa. Se você não tiver uma
assinatura do throughput provisionado e os recursos não estiverem disponíveis
para o aplicativo, um código de erro 429
será retornado. Mesmo que você não
tenha capacidade reservada, tente fazer a solicitação novamente. No entanto, a solicitação não é contabilizada na taxa de erros, conforme descrito no contrato de nível de serviço (SLA).
Para projetos que compraram a capacidade de processamento provisionada,
a Vertex AI mede a capacidade de processamento de um projeto e reserva essa quantidade de
capacidade para que ela esteja disponível. Quando você usa menos do que o valor de throughput
comprado, os erros que poderiam retornar como 429
são retornados como
5XX
e são contados como parte da taxa de erros descrita no SLA.
Pagamento por utilização
No framework de cota de pagamento conforme o uso, você tem as seguintes opções para
resolver erros 429
:
- Implemente uma estratégia de repetição usando a espera exponencial truncada.
- Se você definiu uma substituição do consumidor e a configurou para controlar custos, aumente o limite. Para mais informações, consulte Cota compartilhada dinâmica.
- Inscreva-se na capacidade de processamento provisionada para ter um nível de serviço mais consistente. Para mais informações, consulte Capacidade de processamento provisionada.
A seguir
- Para saber mais sobre a cota compartilhada dinâmica, consulte Cota compartilhada dinâmica.
- Para saber mais sobre cotas e limites da Vertex AI, consulte Cotas e limites da Vertex AI.
- Para saber mais sobre cotas e limites do Google Cloud, consulte Noções básicas sobre valores de cota e limites do sistema.