Se il numero di richieste supera la capacità allocata per l'elaborazione delle richieste, viene restituito il codice di errore 429
. La tabella seguente mostra il messaggio di errore generato da ogni tipo di framework di quote:
Framework per le quote | Messaggio |
---|---|
Pagamento a consumo | Resource exhausted, please try again later. |
Throughput riservato | Too many requests. Exceeded the Provisioned Throughput. |
Con un abbonamento Throughput riservato, puoi riservare una quantità di throughput per modelli di AI generativa specifici. Se non hai un abbonamento a Throughput provisionato e le risorse non sono disponibili per la tua applicazione, viene restituito un codice di errore 429
. Anche se non hai la capacità prenotata, puoi riprovare a inviare la richiesta. Tuttavia, la richiesta non viene conteggiata ai fini della percentuale di errore, come descritto nel tuo accordo sul livello di servizio (SLA).
Per i progetti che hanno acquistato il throughput riservato,
Vertex AI misura il throughput di un progetto e ne riserva la quantità in modo che sia disponibile. Quando utilizzi meno dell'importo del throughput acquistato, gli errori che altrimenti potrebbero essere restituiti come 429
vengono restituiti come
5XX
e vengono conteggiati come parte del tasso di errore descritto nello SLA.
Pagamento a consumo
Nel framework delle quote di pagamento a consumo, hai a disposizione le seguenti opzioni per risolvere gli errori 429
:
- Implementa una strategia di ripetizione utilizzando il backoff esponenziale troncato.
- Se hai impostato una sostituzione del consumatore e la hai configurata per controllare il costo, aumenta il limite. Per ulteriori informazioni, consulta Quota condivisa dinamica.
- Abbonati a Throughput riservato per un livello di servizio più coerente. Per ulteriori informazioni, consulta Throughput riservato.
Passaggi successivi
- Per scoprire di più sulla quota condivisa dinamica, consulta Quota condivisa dinamica.
- Per informazioni su quote e limiti per Vertex AI, consulta Quote e limiti di Vertex AI.
- Per saperne di più sulle quote e sui limiti di Google Cloud, consulta Informazioni sui valori delle quote e sui limiti di sistema.