In diesem Dokument sind die Kontingente und Systemlimits für Gemini in Google Cloudaufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Produkten und Diensten von Google Cloud .
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Anfragen pro Sekunde
Für Gemini for Google Cloud werden Kontingente für jeden Nutzer in einem Projekt für Anfragen pro Sekunde erzwungen.
Kontingent | Wert |
---|---|
Anfragen pro Sekunde | 2 |
Anfragen pro Tag
Bei Gemini for Google Cloud werden Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt erzwungen.
Kontingent | Wert |
---|---|
Anfragen pro Tag für Gemini Code Assist- oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. | 6000 |
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans für Datenstatistiken, Metadatengenerierung, Datenaufbereitung und andere Anfragen, für die Antworten in der Google Cloud Console im Cloud Assist-Bereich und in IDEs angezeigt werden. | 960 |
Kontingente für Gemini Code Assist
Für bestimmte Funktionen von Gemini Code Assist gelten Kontingente.
Kontingent | Wert |
---|---|
Einbeziehung der lokalen Codebasis | Kontextfenster mit 1.000.000 Tokens |
Repositories für die Codeanpassung | 20.000 |
Kontingente für den KI-Agentenmodus und die Gemini-Befehlszeile
Kontingente für Anfragen des Gemini Code Assist-KI-Agentenmodus und der Gemini-Befehlszeile werden kombiniert. Im KI-Agentenmodus oder bei Verwendung der Gemini-Befehlszeile kann ein Prompt zu mehreren Anfragen führen.
Kontingent | Gemini Code Assist-Version | Wert |
---|---|---|
Anfragen pro Nutzer und Minute | Standard | 120 |
Enterprise | 120 | |
Anfragen pro Nutzer und Tag | Standard | 1500 |
Enterprise | 2000 |
Kontingente für Gemini in BigQuery
Für Funktionen zur Codeunterstützung ist das Kontingent für Gemini Code Assist- und Gemini in BigQuery-Codeanfragen für Funktionen wie Codevervollständigung und ‑generierung identisch.
Für Kunden, die Gemini in BigQuery mit BigQuery On-Demand Compute oder mit der Enterprise- oder Enterprise Plus-Version verwenden, werden die Kontingente für erweiterte Funktionen wie Datenanalysen auf Basis der durchschnittlichen täglichen Nutzung von gescannten TiB oder den Slot-Stunden für den letzten vollständigen Kalendermonat bereitgestellt. Dieses Kontingent gilt auf Organisationsebene und ist für alle Projekte in der Organisation verfügbar. Kontingente werden auf die nächste 100-Slot-Stunde aufgerundet.
Kontingente pro 100 Slot-Stunden (durchschnittliche tägliche Nutzung der Enterprise- oder Enterprise Plus-Version) oder pro TiB, das mit dem On-Demand-Compute-Modell gescannt wird | Wert |
---|---|
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans und andere Anfragen, für die Antworten in der Google Cloud Console im Bereich Cloud Assist angezeigt werden. | 5 |
Beispiel: Eine Organisation mit einer Enterprise-Versionsreservierung mit 100 Slots als Baseline verwendet durchschnittlich 2.400 Slot-Stunden pro Tag (100 Slots × 24 Stunden = 2.400 Slot-Stunden). Im Folgemonat erhalten sie daher die folgenden täglichen Kontingente:
- 120 Chats, Visualisierungen, Tabellenscans für Datenstatistiken und automatisierte Metadatengenerierungen pro Tag
Wenn Ihre Organisation bisher keine BigQuery Enterprise- oder Enterprise Plus-Slots oder On-Demand-Compute-TiB erworben hat, erhalten Sie nach der ersten Nutzung für den ersten vollen Kalendermonat das Standardkontingent für Folgendes:
- 250 Chats, Visualisierungen, Tabellenscans für Datenstatistiken und automatisierte Metadatengenerierungen pro Tag
Wenn Sie Reservierungen von On-Demand-Compute, der Enterprise- oder Enterprise Plus-Version erst ab Mitte des Monats verwenden, gilt das Standardkontingent bis zum Ende des Folgemonats.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.