Se il numero di richieste supera la capacità allocata per l'elaborazione delle richieste, viene restituito il codice di errore 429
. La tabella seguente mostra il messaggio di errore generato da ogni tipo di framework di quote:
Framework per le quote | Messaggio |
---|---|
Pagamento a consumo | Resource exhausted, please try again later. |
Throughput riservato | Too many requests. Exceeded the Provisioned Throughput. |
Con un abbonamento Throughput riservato, puoi riservare una quantità di throughput per modelli di AI generativa specifici. Se non hai un abbonamento a Throughput Provisioning e le risorse non sono disponibili per la tua applicazione, viene restituito un codice di errore 429
. Anche se non hai la capacità prenotata, puoi riprovare a inviare la richiesta. Tuttavia, la richiesta non viene conteggiata ai fini del calcolo della percentuale di errore, come descritto nel tuo accordo sul livello di servizio (SLA).
Per i progetti che hanno acquistato il throughput riservato,
Vertex AI misura il throughput di un progetto e ne riserva la quantità in modo che sia disponibile. Quando utilizzi meno dell'importo del throughput acquistato, gli errori che altrimenti potrebbero essere restituiti come 429
vengono restituiti come
5XX
e vengono conteggiati come parte del tasso di errore descritto nello SLA.
Pagamento a consumo
Nel framework delle quote di pagamento a consumo, hai a disposizione le seguenti opzioni per risolvere gli errori 429
:
- Implementa una strategia di ripetizione utilizzando il backoff esponenziale troncato.
- Se hai impostato una sostituzione del consumatore e la hai configurata per controllare il costo, aumenta il limite. Per ulteriori informazioni, consulta Quota condivisa dinamica.
- Abbonati a Throughput riservato per un livello di servizio più coerente. Per ulteriori informazioni, consulta Throughput riservato.
Throughput riservato
Per correggere l'errore 429 generato dal throughput Provisioning, segui questi passaggi:
- Utilizza l'esempio di comportamento predefinito, che non imposta un header nelle richieste di previsione. Eventuali superamenti vengono elaborati on demand e fatturati come pagamento a consumo.
- Aumenta il numero di GSU nell'abbonamento con throughput pianificato.
Passaggi successivi
- Per scoprire di più sulla quota condivisa dinamica, consulta Quota condivisa dinamica.
- Per scoprire di più sul throughput riservato, consulta Throughput riservato.
- Per informazioni su quote e limiti per Vertex AI, consulta Quote e limiti di Vertex AI.
- Per saperne di più su Google Cloud quote e limiti, consulta Informazioni sui valori delle quote e sui limiti di sistema.