A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Se il numero di richieste supera la capacità allocata per l'elaborazione delle richieste, viene restituito il codice di errore 429. La tabella seguente mostra il
messaggio di errore generato da ogni tipo di framework delle quote:
Framework per le quote
Messaggio
Pagamento a consumo
Resource exhausted, please try again later.
Throughput riservato
Too many requests. Exceeded the Provisioned Throughput.
Con un abbonamento al Throughput riservato, puoi riservare una
quantità di throughput per modelli di AI generativa specifici. Se non hai un abbonamento
Provisioned Throughput e le risorse non sono disponibili
per la tua applicazione, viene restituito un codice di errore 429. Anche se non hai
capacità riservata, puoi riprovare a inviare la richiesta. Tuttavia, la richiesta
non viene conteggiata ai fini della percentuale di errore, come descritto nell'accordo sul livello di
servizio (SLA).
Per i progetti che hanno acquistato il throughput di cui è stato eseguito il provisioning,
Vertex AI misura il throughput di un progetto e riserva la quantità di throughput acquistata
per l'utilizzo effettivo del progetto.
Per la capacità di trasmissione di cui è stato eseguito il provisioning standard, quando utilizzi un importo inferiore a quello acquistato, gli errori che altrimenti potrebbero essere 429 vengono restituiti come 5XX e vengono conteggiati ai fini del tasso di errore SLA. Per il throughput di cui è stato eseguito il provisioning a zona singola,
quando utilizzi un importo inferiore a quello acquistato, gli errori 429 correlati alla capacità
vengono trattati come 5XX, ma non vengono conteggiati ai fini del tasso di errore dello SLA. Quando superi l'importo
acquistato, le richieste aggiuntive vengono elaborate on demand con pagamento a consumo.
Pagamento a consumo
Nel framework delle quote con pagamento a consumo, hai le seguenti opzioni per
risolvere gli errori 429:
Se possibile, utilizza l'endpoint globale anziché un endpoint regionale.
Se il tuo modello utilizza quote, puoi inviare una richiesta di aumento della quota (QIR). Se
il tuo modello utilizza la quota
condivisa dinamica, può essere utile
uniformare il traffico e ridurre i picchi elevati. Per ulteriori informazioni, consulta Quota condivisa dinamica (DSQ).
Abbonati al throughput riservato per un livello di servizio più coerente.
Per saperne di più, consulta la sezione
Throughput riservato.
Throughput riservato
Per correggere l'errore 429 generato da Provisioned Throughput, procedi nel seguente modo:
Utilizza l'esempio di comportamento predefinito, che non imposta un'intestazione nelle richieste di previsione. Eventuali superamenti vengono elaborati on demand e fatturati
in base al pagamento a consumo.
Aumenta il numero di GSU nell'abbonamento al throughput di cui è stato eseguito il provisioning.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Error code 429\n\nIf the number of your requests exceeds the capacity allocated to process\nrequests, then error code `429` is returned. The following table displays the\nerror message generated by each type of quota framework:\n\nWith a Provisioned Throughput subscription, you can reserve an\namount of throughput for specific generative AI models. If you don't have a\nProvisioned Throughput subscription and resources aren't available\nto your application, then an error code `429` is returned. Although you don't\nhave reserved capacity, you can try your request again. However, the request\nisn't counted against your error rate as described in your [service level\nagreement (SLA)](/vertex-ai/generative-ai/sla).\n\nFor projects that have purchased Provisioned Throughput,\nVertex AI measures a project's throughput and reserves the purchased\namount of throughput for the project's actual usage.\n\nFor standard Provisioned Throughput, when you use less than your\npurchased amount, errors that might otherwise be `429` are returned as `5XX` and\ncount toward the SLA error rate. For Single Zone Provisioned Throughput,\nwhen you use less than your purchased amount, capacity-related `429` errors are\ntreated as `5XX` but don't count toward the SLA error rate. When you exceed your\npurchased amount, the additional requests are processed on-demand as pay-as-you-go.\n\nPay-as-you-go\n-------------\n\nOn the pay-as-you-go quota framework, you have the following options to\nresolving `429` errors:\n\n- Use the [global endpoint](/vertex-ai/generative-ai/docs/learn/locations#global-endpoint) instead of a regional endpoint whenever possible.\n- Implement a retry strategy by using [truncated exponential backoff](/storage/docs/retry-strategy#exponential-backoff).\n- If your model uses quotas, you can submit a Quota Increase Request (QIR). If your model uses [Dynamic shared\n quota](/vertex-ai/generative-ai/docs/dynamic-shared-quota#supported_models), smoothing traffic and reducing large spikes can help. For more information, see [Dynamic shared\n quota (DSQ)](/vertex-ai/generative-ai/docs/dynamic-shared-quota).\n- Subscribe to Provisioned Throughput for a more consistent level of service. For more information, see [Provisioned Throughput](/vertex-ai/generative-ai/docs/provisioned-throughput).\n\nProvisioned Throughput\n----------------------\n\nTo correct the 429 error generated by Provisioned Throughput, do the\nfollowing:\n\n- Use the [Default behavior\n example](/vertex-ai/generative-ai/docs/use-provisioned-throughput#default), which doesn't set a header in prediction requests. Any overages are processed on-demand and billed as pay-as-you-go.\n- Increase the number of GSUs in your Provisioned Throughput subscription.\n\nWhat's next\n-----------\n\n- To learn more about dynamic shared quota, see [Dynamic shared\n quota](/vertex-ai/generative-ai/docs/dsq).\n- To learn more about Provisioned Throughput, see [Provisioned Throughput](/vertex-ai/generative-ai/docs/provisioned-throughput).\n- To learn about quotas and limits for Vertex AI, see [Vertex AI quotas and limits](/vertex-ai/docs/quotas).\n- To learn more about Google Cloud quotas and system limits, see the [Cloud Quotas documentation](/docs/quotas/overview).\n- To learn more about API errors, see [API errors](/vertex-ai/generative-ai/docs/model-reference/api-errors)."]]