Codice di errore 429

Se il numero di richieste supera la capacità allocata per l'elaborazione delle richieste, viene restituito il codice di errore 429. La tabella seguente mostra il messaggio di errore generato da ogni tipo di framework di quote:

Framework per le quote Messaggio
Pagamento a consumo Resource exhausted, please try again later.
Throughput riservato Too many requests. Exceeded the Provisioned Throughput.

Con un abbonamento Throughput riservato, puoi riservare una quantità di throughput per modelli di AI generativa specifici. Se non hai un abbonamento a Throughput provisionato e le risorse non sono disponibili per la tua applicazione, viene restituito un codice di errore 429. Anche se non hai la capacità prenotata, puoi riprovare a inviare la richiesta. Tuttavia, la richiesta non viene conteggiata ai fini della percentuale di errore, come descritto nel tuo accordo sul livello di servizio (SLA).

Per i progetti che hanno acquistato il throughput riservato, Vertex AI misura il throughput di un progetto e ne riserva la quantità in modo che sia disponibile. Quando utilizzi meno dell'importo del throughput acquistato, gli errori che altrimenti potrebbero essere restituiti come 429 vengono restituiti come 5XX e vengono conteggiati come parte del tasso di errore descritto nello SLA.

Pagamento a consumo

Nel framework delle quote di pagamento a consumo, hai a disposizione le seguenti opzioni per risolvere gli errori 429:

  • Implementa una strategia di ripetizione utilizzando il backoff esponenziale troncato.
  • Se hai impostato una sostituzione del consumatore e la hai configurata per controllare il costo, aumenta il limite. Per ulteriori informazioni, consulta Quota condivisa dinamica.
  • Abbonati a Throughput riservato per un livello di servizio più coerente. Per ulteriori informazioni, consulta Throughput riservato.

Passaggi successivi