In diesem Dokument sind die Kontingente und Systemlimits für Gemini für Google Cloud. Kontingente geben die Menge einer zählbaren, gemeinsam genutzten Ressource an, die Sie verwenden können und die von Google Cloud-Diensten wie Gemini für Google Cloud. Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Anfragen pro Sekunde
Gemini for Google Cloud erzwingt Kontingente für Anfragen pro Sekunde für jeden Nutzer in einem Projekt.
Kontingent | Wert |
---|---|
Anfragen pro Sekunde | 2 |
Anfragen pro Tag
Gemini für Google Cloud erzwingt Kontingente für die Gesamtzahl der -Anfragen pro Tag für jeden Nutzer in einem Projekt.
Kontingent | Wert |
---|---|
Anzahl der Anfragen pro Tag für Codeanfragen von Gemini Code Assist oder Gemini in BigQuery, z. B. Codegenerierung und Codevervollständigung. | 6000 |
Anzahl der Anfragen pro Tag für Chat, Visualisierung, Datenanalysen und andere Anfragen, für die Antworten im Bereich Gemini in der Google Cloud Console und in IDEs angezeigt werden. | 240 |
Kontingente für Gemini Code Assist
Gemini Code Assist erzwingt Kontingente für bestimmte Funktionen.
Kontingent | Wert |
---|---|
Bekanntheit der lokalen Codebasis | Kontextfenster mit 128.000 Tokens |
Repositories für Codeanpassung | 950 |
Kontingente für Gemini in BigQuery
Für Kunden, die Gemini in BigQuery mit Die Kontingente der BigQuery Enterprise Plus-Version basieren auf die durchschnittliche tägliche Nutzung von Enterprise Plus-Slotstunden für den letzten vollen Kalender Monat. Dieses Kontingent gilt für die Organisationsebene und ist für alle Projekte in dieser Organisation verfügbar, denen Slots für die Enterprise Plus-Version zugewiesen sind. Kontingente werden auf die nächsten 100 Slot-Stunden aufgerundet.
Kontingente pro 100 Slot-Stunden (tägliche durchschnittliche Nutzung der Enterprise Plus-Version) | Wert |
---|---|
Anfragen zur Codevervollständigung pro Tag | 150 |
Anfragen zur Codegenerierung pro Tag | 10 |
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans und andere Anfragen, bei denen Antworten im Gemini-Bereich im Google Cloud Console | 5 |
Beispiel: Eine Organisation mit einer Reservierung für die Enterprise Plus-Version mit 100 Slots als Baseline nutzt durchschnittlich 2.400 Slotstunden pro Tag (100 Slots × 24 Stunden = 2.400 Slotstunden). Daher können wir in den folgenden Monat erhalten sie die folgenden Tageskontingente:
- 3.600 Codevervollständigungsanfragen pro Tag
- 240 Anfragen zur Codegenerierung pro Tag
- 120 Scans aus Chat-, Visualisierungs- und Datenstatistiken pro Tag
Wenn Ihre Organisation noch kein BigQuery Enterprise erworben hat Reservierungen für die Plus-Version bis jetzt, danach nach dem Kauf von Enterprise Plus Versionsreservierung erhalten Sie das folgende Standardkontingent für die Erster voller Kalendermonat:
- 7.500 Anfragen zur Codevervollständigung pro Tag
- 500 Anfragen zur Codegenerierung pro Tag
- 250 Scans für Chats, Visualisierungen und Datenstatistiken pro Tag
Wenn Sie erst Mitte des Monats mit der Verwendung von Reservierungen für die Enterprise Plus-Version beginnen, gilt das Standardkontingent bis zum Ende des Folgemonats.
Kontingenterhöhung anfordern
Für die Anpassung der meisten Kontingente verwenden Sie die Google Cloud Console. Weitere Informationen finden Sie unter Fordern Sie eine Kontingentanpassung an.