Auf dieser Seite wird das dynamische freigegebene Kontingent (DSQ) erläutert und wie es sich vom bereitgestellten Durchsatz unterscheidet.
Einführung in das dynamische freigegebene Kontingent
Das dynamische gemeinsame Kontingent (Dynamic Shared Quota, DSQ) verteilt die verfügbare On-Demand-Kapazität auf alle Abfragen, die von Google Cloud -Diensten für bestimmte Modelle verarbeitet werden. Dadurch müssen Sie keine Kontingentlimits festlegen und keine Anfragen zur Kontingenterhöhung mehr senden.
DSQ verarbeitet Anfragen von allen Kunden an dieselben regionalen oder mehrregionalen Endpunkte. Kontingente werden entfernt und die verfügbare Kapazität wird auf die einzelnen Projekte verteilt.
Provisioned Throughput ist die einzige Möglichkeit, für Ihre Anwendung eine hohe Verfügbarkeit zu gewährleisten und vorhersehbare Dienstebenen für Ihre Produktionsarbeitslasten zu erhalten. Weitere Informationen zum bereitgestellten Durchsatz finden Sie unter Bereitgestellter Durchsatz.
Unterstützte Modelle
In diesem Abschnitt sind Modelle aufgeführt, die das dynamische gemeinsame Kontingent (DSQ) unterstützen, das in diesen Modellen standardmäßig aktiviert ist.
Google-Modelle
In der folgenden Tabelle sind die Google-Modelle (und -Versionen) aufgeführt, die DSQ unterstützen:
Modell | Veröffentlichungsdatum der DSQ | Status |
---|---|---|
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001 ) |
25. Februar 2025 | Live |
Gemini 2.0 Flash (gemini-2.0-flash-001 ) |
5. Februar 2025 | Live |
Gemini 1.5 Flash (gemini-1.5-flash-002 ) |
24. September 2024 | Live |
Gemini 1.5 Pro (gemini-1.5-pro-002 ) |
24. September 2024 | Live |
DSQ-Kontingente werden in der Google Cloud Console auf der Seite Kontingente und Systemlimits nicht aufgeführt.
DSQ-Fehler beheben
Wenn nicht genügend Kapazität vorhanden ist, um Ihre Anfrage zu bedienen, erhalten Sie möglicherweise den Fehler 429. Informationen zur Fehlerbehebung finden Sie unter Fehlercode 429.
Nächste Schritte
- Weitere Informationen zu Gemini-Modellen, die DSQ unterstützen, finden Sie unter Gemini-Modelle.
- Weitere Informationen zu Kontingenten und Limits für Generative AI finden Sie unter Ratenlimits für Generative AI in Vertex AI.
- Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
- Weitere Informationen zu Google Cloud Kontingenten und Limits finden Sie unter Informationen zu Kontingentwerten und Systemlimits.