Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Wenn die Anzahl Ihrer Anfragen die für die Verarbeitung von Anfragen zugewiesene Kapazität überschreitet, wird der Fehlercode 429 zurückgegeben. In der folgenden Tabelle sehen Sie die Fehlermeldung, die von den einzelnen Kontingenttypen generiert wird:
Kontingentrahmen
Nachricht
Pay as you go
Resource exhausted, please try again later.
Bereitgestellter Durchsatz
Too many requests. Exceeded the Provisioned Throughput.
Mit einem Provisioned Throughput-Abo können Sie eine bestimmte Menge an Durchsatz für bestimmte generative KI-Modelle reservieren. Wenn Sie kein Provisioned Throughput-Abo haben und Ihrer Anwendung keine Ressourcen zur Verfügung stehen, wird der Fehlercode 429 zurückgegeben. Obwohl Sie keine reservierte Kapazität haben, können Sie Ihre Anfrage noch einmal versuchen. Die Anfrage wird jedoch nicht auf Ihre Fehlerrate angerechnet, wie in Ihrem Service Level Agreement (SLA) beschrieben.
Bei Projekten, für die bereitgestellter Durchsatz erworben wurde, misst Vertex AI den Durchsatz eines Projekts und reserviert den gekauften Durchsatz für die tatsächliche Nutzung des Projekts.
Wenn Sie bei standardmäßigem bereitgestellten Durchsatz weniger als die gekaufte Menge verwenden, werden Fehler, die ansonsten 429 wären, als 5XX zurückgegeben und auf die SLA-Fehlerrate angerechnet. Wenn Sie bei Provisioned Throughput für eine einzelne Zone weniger als die gekaufte Menge verwenden, werden kapazitätsbezogene 429-Fehler als 5XX behandelt, werden aber nicht auf die SLA-Fehlerrate angerechnet. Wenn Sie die gekaufte Menge überschreiten, werden die zusätzlichen Anfragen On-Demand als „Pay-as-you-go“ verarbeitet.
Pay as you go
Im Rahmen des Kontingentmodells mit nutzungsabhängiger Bezahlung haben Sie die folgenden Möglichkeiten, 429-Fehler zu beheben:
Verwenden Sie nach Möglichkeit den globalen Endpunkt anstelle eines regionalen Endpunkts.
Wenn für Ihr Modell Kontingente gelten, können Sie eine Anfrage zur Kontingenterhöhung einreichen. Wenn Ihr Modell dynamisches gemeinsames Kontingent verwendet, kann es helfen, den Traffic zu glätten und große Spitzen zu reduzieren. Weitere Informationen finden Sie unter Dynamisches gemeinsames Kontingent (DSQ).
Abonnieren Sie bereitgestellten Durchsatz, um ein konsistenteres Serviceniveau zu erhalten.
Weitere Informationen finden Sie unter Bereitgestellter Durchsatz.
Bereitgestellter Durchsatz
So beheben Sie den Fehler 429, der durch Provisioned Throughput generiert wird:
Verwenden Sie das Beispiel für das Standardverhalten, in dem kein Header in Vorhersageanfragen festgelegt wird. Überschreitungen werden On-Demand verarbeitet und als „Pay-as-you-go“ abgerechnet.
Erhöhen Sie die Anzahl der GSUs in Ihrem Provisioned Throughput-Abo.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[],[],null,["# Error code 429\n\nIf the number of your requests exceeds the capacity allocated to process\nrequests, then error code `429` is returned. The following table displays the\nerror message generated by each type of quota framework:\n\nWith a Provisioned Throughput subscription, you can reserve an\namount of throughput for specific generative AI models. If you don't have a\nProvisioned Throughput subscription and resources aren't available\nto your application, then an error code `429` is returned. Although you don't\nhave reserved capacity, you can try your request again. However, the request\nisn't counted against your error rate as described in your [service level\nagreement (SLA)](/vertex-ai/generative-ai/sla).\n\nFor projects that have purchased Provisioned Throughput,\nVertex AI measures a project's throughput and reserves the purchased\namount of throughput for the project's actual usage.\n\nFor standard Provisioned Throughput, when you use less than your\npurchased amount, errors that might otherwise be `429` are returned as `5XX` and\ncount toward the SLA error rate. For Single Zone Provisioned Throughput,\nwhen you use less than your purchased amount, capacity-related `429` errors are\ntreated as `5XX` but don't count toward the SLA error rate. When you exceed your\npurchased amount, the additional requests are processed on-demand as pay-as-you-go.\n\nPay-as-you-go\n-------------\n\nOn the pay-as-you-go quota framework, you have the following options to\nresolving `429` errors:\n\n- Use the [global endpoint](/vertex-ai/generative-ai/docs/learn/locations#global-endpoint) instead of a regional endpoint whenever possible.\n- Implement a retry strategy by using [truncated exponential backoff](/storage/docs/retry-strategy#exponential-backoff).\n- If your model uses quotas, you can submit a Quota Increase Request (QIR). If your model uses [Dynamic shared\n quota](/vertex-ai/generative-ai/docs/dynamic-shared-quota#supported_models), smoothing traffic and reducing large spikes can help. For more information, see [Dynamic shared\n quota (DSQ)](/vertex-ai/generative-ai/docs/dynamic-shared-quota).\n- Subscribe to Provisioned Throughput for a more consistent level of service. For more information, see [Provisioned Throughput](/vertex-ai/generative-ai/docs/provisioned-throughput).\n\nProvisioned Throughput\n----------------------\n\nTo correct the 429 error generated by Provisioned Throughput, do the\nfollowing:\n\n- Use the [Default behavior\n example](/vertex-ai/generative-ai/docs/use-provisioned-throughput#default), which doesn't set a header in prediction requests. Any overages are processed on-demand and billed as pay-as-you-go.\n- Increase the number of GSUs in your Provisioned Throughput subscription.\n\nWhat's next\n-----------\n\n- To learn more about dynamic shared quota, see [Dynamic shared\n quota](/vertex-ai/generative-ai/docs/dsq).\n- To learn more about Provisioned Throughput, see [Provisioned Throughput](/vertex-ai/generative-ai/docs/provisioned-throughput).\n- To learn about quotas and limits for Vertex AI, see [Vertex AI quotas and limits](/vertex-ai/docs/quotas).\n- To learn more about Google Cloud quotas and system limits, see the [Cloud Quotas documentation](/docs/quotas/overview).\n- To learn more about API errors, see [API errors](/vertex-ai/generative-ai/docs/model-reference/api-errors)."]]