Dynamisches freigegebenes Kontingent

Auf dieser Seite wird das dynamische freigegebene Kontingent (DSQ) erläutert und wie es sich vom bereitgestellten Durchsatz unterscheidet.

Einführung in das dynamische freigegebene Kontingent

Das dynamische gemeinsame Kontingent (Dynamic Shared Quota, DSQ) verteilt die verfügbare On-Demand-Kapazität auf alle Abfragen, die von Google Cloud -Diensten für bestimmte Modelle verarbeitet werden. Dadurch müssen Sie keine Kontingentlimits festlegen und keine Anfragen zur Kontingenterhöhung mehr senden.

DSQ verarbeitet Anfragen von allen Kunden an dieselben regionalen oder mehrregionalen Endpunkte. Kontingente werden entfernt und die verfügbare Kapazität wird auf die einzelnen Projekte verteilt.

Provisioned Throughput ist die einzige Möglichkeit, für Ihre Anwendung eine hohe Verfügbarkeit zu gewährleisten und vorhersehbare Dienstebenen für Ihre Produktionsarbeitslasten zu erhalten. Weitere Informationen zum bereitgestellten Durchsatz finden Sie unter Bereitgestellter Durchsatz.

Unterstützte Modelle

In diesem Abschnitt sind Modelle aufgeführt, die das dynamische gemeinsame Kontingent (DSQ) unterstützen, das in diesen Modellen standardmäßig aktiviert ist.

Google-Modelle

In der folgenden Tabelle sind die Google-Modelle (und -Versionen) aufgeführt, die DSQ unterstützen:

Modell Veröffentlichungsdatum der DSQ Status
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001) 25. Februar 2025 Live
Gemini 2.0 Flash (gemini-2.0-flash-001) 5. Februar 2025 Live
Gemini 1.5 Flash (gemini-1.5-flash-002) 24. September 2024 Live
Gemini 1.5 Pro (gemini-1.5-pro-002) 24. September 2024 Live

DSQ-Kontingente werden in der Google Cloud Console auf der Seite Kontingente und Systemlimits nicht aufgeführt.

DSQ-Fehler beheben

Wenn nicht genügend Kapazität vorhanden ist, um Ihre Anfrage zu bedienen, erhalten Sie möglicherweise den Fehler 429. Informationen zur Fehlerbehebung finden Sie unter Fehlercode 429.

Nächste Schritte