Diese Seite wurde von der Cloud Translation API übersetzt.

Dynamisches freigegebenes Kontingent

Auf dieser Seite wird das dynamische freigegebene Kontingent (DSQ) erläutert und wie es sich vom bereitgestellten Durchsatz unterscheidet.

Einführung in das dynamische freigegebene Kontingent

Das dynamische gemeinsame Kontingent (Dynamic Shared Quota, DSQ) verteilt die verfügbare On-Demand-Kapazität auf alle Abfragen, die von Google Cloud -Diensten für bestimmte Modelle verarbeitet werden. Dadurch müssen Sie keine Kontingentlimits festlegen und keine Anfragen zur Kontingenterhöhung mehr senden.

DSQ verarbeitet Anfragen von allen Kunden an dieselben regionalen oder mehrregionalen Endpunkte. Kontingente werden entfernt und die verfügbare Kapazität wird auf die einzelnen Projekte verteilt.

Provisioned Throughput ist die einzige Möglichkeit, für Ihre Anwendung eine hohe Verfügbarkeit zu gewährleisten und vorhersehbare Dienstebenen für Ihre Produktionsarbeitslasten zu erhalten. Weitere Informationen zum bereitgestellten Durchsatz finden Sie unter Bereitgestellter Durchsatz.

Unterstützte Modelle

In diesem Abschnitt sind Modelle aufgeführt, die das dynamische gemeinsame Kontingent (DSQ) unterstützen, das in diesen Modellen standardmäßig aktiviert ist.

Google-Modelle

In der folgenden Tabelle sind die Google-Modelle (und -Versionen) aufgeführt, die DSQ unterstützen:

Modell	Veröffentlichungsdatum der DSQ	Status
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)	25. Februar 2025	Live
Gemini 2.0 Flash (`gemini-2.0-flash-001`)	5. Februar 2025	Live
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	24. September 2024	Live
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	24. September 2024	Live

DSQ-Kontingente werden in der Google Cloud Console auf der Seite Kontingente und Systemlimits nicht aufgeführt.

DSQ-Fehler beheben

Wenn nicht genügend Kapazität vorhanden ist, um Ihre Anfrage zu bedienen, erhalten Sie möglicherweise den Fehler 429. Informationen zur Fehlerbehebung finden Sie unter Fehlercode 429.

Nächste Schritte

Weitere Informationen zu Gemini-Modellen, die DSQ unterstützen, finden Sie unter Gemini-Modelle.
Weitere Informationen zu Kontingenten und Limits für Generative AI finden Sie unter Ratenlimits für Generative AI in Vertex AI.
Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
Weitere Informationen zu Google Cloud Kontingenten und Limits finden Sie unter Informationen zu Kontingentwerten und Systemlimits.

Dynamisches freigegebenes Kontingent Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.