Kontingente und Limits

In diesem Dokument sind die Kontingente und Systemlimits für Gemini in Google Cloudaufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.

Anfragen pro Sekunde

Für Gemini for Google Cloud werden Kontingente für jeden Nutzer in einem Projekt für Anfragen pro Sekunde erzwungen.

Kontingent Wert
Anfragen pro Sekunde 2

Anfragen pro Tag

Bei Gemini for Google Cloud werden Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt erzwungen.

Kontingent Wert
Anfragen pro Tag für Gemini Code Assist- oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. 6000
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans für Datenstatistiken, Metadatengenerierung, Datenaufbereitung und andere Anfragen, für die Antworten in der Google Cloud Console im Cloud Assist-Bereich und in IDEs angezeigt werden. 960

Kontingente für Gemini Code Assist

Für bestimmte Funktionen von Gemini Code Assist gelten Kontingente.

Kontingent Wert
Einbeziehung der lokalen Codebasis Kontextfenster mit 1.000.000 Tokens
Repositories für die Codeanpassung 20.000

Kontingente für den KI-Agentenmodus und die Gemini-Befehlszeile

Kontingente für Anfragen des Gemini Code Assist-KI-Agentenmodus und der Gemini-Befehlszeile werden kombiniert. Im KI-Agentenmodus oder bei Verwendung der Gemini-Befehlszeile kann ein Prompt zu mehreren Anfragen führen.

Kontingent Gemini Code Assist-Version Wert
Anfragen pro Nutzer und Minute Standard 120
Enterprise 120
Anfragen pro Nutzer und Tag Standard 1500
Enterprise 2000

Kontingente für Gemini in BigQuery

Für Funktionen zur Codeunterstützung ist das Kontingent für Gemini Code Assist- und Gemini in BigQuery-Codeanfragen für Funktionen wie Codevervollständigung und ‑generierung identisch.

Für Kunden, die Gemini in BigQuery mit BigQuery On-Demand Compute oder mit der Enterprise- oder Enterprise Plus-Version verwenden, werden die Kontingente für erweiterte Funktionen wie Datenanalysen auf Basis der durchschnittlichen täglichen Nutzung von gescannten TiB oder den Slot-Stunden für den letzten vollständigen Kalendermonat bereitgestellt. Dieses Kontingent gilt auf Organisationsebene und ist für alle Projekte in der Organisation verfügbar. Kontingente werden auf die nächste 100-Slot-Stunde aufgerundet.

Kontingente pro 100 Slot-Stunden (durchschnittliche tägliche Nutzung der Enterprise- oder Enterprise Plus-Version) oder pro TiB, das mit dem On-Demand-Compute-Modell gescannt wird Wert
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans und andere Anfragen, für die Antworten in der Google Cloud Console im Bereich Cloud Assist angezeigt werden. 5

Beispiel: Eine Organisation mit einer Enterprise-Versionsreservierung mit 100 Slots als Baseline verwendet durchschnittlich 2.400 Slot-Stunden pro Tag (100 Slots × 24 Stunden = 2.400 Slot-Stunden). Im Folgemonat erhalten sie daher die folgenden täglichen Kontingente:

  • 120 Chats, Visualisierungen, Tabellenscans für Datenstatistiken und automatisierte Metadatengenerierungen pro Tag

Wenn Ihre Organisation bisher keine BigQuery Enterprise- oder Enterprise Plus-Slots oder On-Demand-Compute-TiB erworben hat, erhalten Sie nach der ersten Nutzung für den ersten vollen Kalendermonat das Standardkontingent für Folgendes:

  • 250 Chats, Visualisierungen, Tabellenscans für Datenstatistiken und automatisierte Metadatengenerierungen pro Tag

Wenn Sie Reservierungen von On-Demand-Compute, der Enterprise- oder Enterprise Plus-Version erst ab Mitte des Monats verwenden, gilt das Standardkontingent bis zum Ende des Folgemonats.

Kontingenterhöhung anfordern

Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.