In diesem Dokument wird beschrieben, wie Sie Kontingente mithilfe des Kontingentanpassungssystems anpassen.
Die Kontingentanpassung beobachtet Ihren Ressourcenverbrauch und sendet proaktiv Anfragen zur Kontingentanpassung in Ihrem Namen. Wenn Sie Ihre Ressourcennutzung im Blick behalten und proaktiv Anträge auf Kontingentanpassung stellen, können Sie Ausfälle vermeiden, die durch das Erreichen Ihres Kontingentwerts verursacht werden. Mit der Kontingentanpassung müssen Sie weniger auf ungeplante Steigerungen der Ressourcennutzung achten und können weniger manuelle Anträge auf Kontingentanpassungen stellen.
Funktionsweise der Kontingentanpassung
Wenn Sie die Kontingentanpassung aktivieren, werden alle anwendbaren Kontingente überwacht und die folgende Logik wird angewendet:
- Die Kontingentanpassung prüft, ob die Spitzennutzung während eines bestimmten Zeitraums das Kontingentwert erreicht hat.
- Wenn ja, versucht die Kontingentanpassung, das Kontingentlimit zu erhöhen (in der Regel etwa 10 bis 20 %).
Wenn es möglich ist, den Kontingentwert zu erhöhen, wird die Erhöhung genehmigt und der Wert angepasst. Sie können jederzeit manuell Erhöhungen für Kontingentwerte anfordern, unabhängig davon, ob die Kontingentanpassung aktiviert ist oder nicht.
Die Kontingentanpassung sendet nur Anfragen zur Kontingentanpassung, um den Wert eines Kontingents zu erhöhen. Es wird nicht versucht, den Wert zu senken. Für Kontingente mit einer manuellen Kontingentobergrenze werden keine Anfragen zur Kontingentanpassung eingereicht.
Sie können Anfragen, die von der Kontingentanpassung gesendet wurden, in derGoogle Cloud Console auf der Seite „Kontingente und Systemlimits“ einsehen. Sie können auch Benachrichtigungen einrichten, um Änderungen zu überwachen, die durch die Kontingentanpassung initiiert wurden.
Beschränkungen
Für die Kontingentanpassung gelten die folgenden Einschränkungen:
- Die Einstellungen für die Kontingentanpassung sind nur auf Projektbasis verfügbar.
- Die Einstellungen für die Kontingentanpassung sind nur über dieGoogle Cloud -Konsole zugänglich.
- Der Kontingent-Adjuster ist nicht für alle Kontingente verfügbar. Weitere Informationen finden Sie in diesem Dokument unter Verfügbarkeit.
Verfügbarkeit
Die Verfügbarkeit der Kontingentanpassung hängt von Ihrem Google Cloud Projekt ab und ist nur für einige Google Cloud Kontingente verfügbar.
Anspruch basierend auf dem Nutzungsverlauf
Für die Kontingentanpassung ist eine ausreichende Menge an Verlaufsdaten zur Nutzung erforderlich, um genau bestimmen zu können, wann zusätzliche Kontingente angefordert werden sollen. Aus diesem Grund ist die Option zur Aktivierung der Kontingentanpassung nur für Projekte mit ausreichend früheren Aktivitäten verfügbar, um genaue Vorhersagen zu unterstützen.
Unterstützte Kontingente
Die Kontingentanpassung ist nicht für alleGoogle Cloud -Kontingente verfügbar. Ein Google Cloud -Dienst unterstützt den Kontingent-Adjuster möglicherweise für alle, einige oder keine seiner Kontingente. Wenn Sie die Kontingentanpassung für Ihr Projekt aktivieren, wird sie auf alle unterstützten Kontingente angewendet.
Wenn ein Google Cloud -Dienst die Unterstützung der Kontingentanpassung für seine Kontingente hinzufügt oder erweitert, überwacht und passt die Kontingentanpassung diese neu unterstützten Kontingente automatisch für Ihr Projekt an. Das passiert auch dann, wenn diese spezifischen Kontingente nicht unterstützt wurden, als Sie den Kontingent-Adjuster ursprünglich aktiviert haben.
In der folgenden Tabelle sind die Kontingente aufgeführt, die vom Kontingent-Tool unterstützt werden.
Dienst | Kontingente |
---|---|
Artifact Registry API | Anfragen pro Projekt in der Multi-Region „Asien“ pro Minute |
Artifact Registry API | Anfragen pro Projekt in der Mehrfachregion Europa pro Minute |
Artifact Registry API | Anfragen pro Projekt in der US-Mehrfachregion pro Minute |
Artifact Registry API | Anfragen pro Projekt pro Region und Minute pro Region |
Cloud Build API | Build- und Operation-Get-Anfragen pro Minute |
Cloud Build API | Build- und Operation-Get-Anfragen pro Minute und Nutzer |
Cloud Build API | Gleichzeitige Build-CPUs (regionaler Standardpool) |
Cloud Build API | Gleichzeitige Builds (nicht regionaler Standardpool) |
Cloud Key Management Service API | Kryptografische Anfragen pro Minute |
Cloud Key Management Service API | Leseanfragen pro Minute |
Cloud Key Management Service API | Schreibanfragen pro Minute |
Cloud Logging API | Geschriebene Log-Byte pro Minute und Region |
Cloud Resource Manager API | Leseanfragen pro Minute |
Cloud Run Admin API | Anfragen für Jobausführungen pro Minute und Region |
Cloud Run Admin API | Leseanfragen pro Minute und Region |
Cloud Run Admin API | Gesamte CPU-Zuweisung in Milli-vCPUs pro Projekt und Region |
Cloud Run Admin API | Leseanfragen pro Minute und Region |
Cloud Trace API | Schreibanfragen (kostenlos) pro Minute |
Compute Engine API | Affinitätsgruppen |
Compute Engine API | Backend-Buckets |
Compute Engine API | C2-CPUs |
Compute Engine API | C2D-CPUs |
Compute Engine API | C3-CPUs |
Compute Engine API | Zusicherungen |
Compute Engine API | Zugesicherte A2-CPUs |
Compute Engine API | Zugesicherte CPUs |
Compute Engine API | Vergebene Lizenzen |
Compute Engine API | Reservierter zugesicherter lokaler SSD-Speicherplatz (GB) |
Compute Engine API | Zugesicherte M3-CPUs |
Compute Engine API | Zugesicherte speicheroptimierte CPUs |
Compute Engine API | Zugesicherte N2-CPUs |
Compute Engine API | Zugesicherte N2D-CPUs |
Compute Engine API | Zugesicherte T2D-CPUs |
Compute Engine API | CPUs |
Compute Engine API | CPUs pro VM-Familie |
Compute Engine API | Projekte mit projektübergreifendem Netzwerkdienst |
Compute Engine API | Benutzerdefinierte statische Routen pro VPC-Netzwerk |
Compute Engine API | Externe Passthrough-Back-End-Dienste des Netzwerk-Load-Balancers |
Compute Engine API | Weiterleitungsregeln für externe Passthrough-Network-Load-Balancer |
Compute Engine API | Weiterleitungsregeln für externe Protokolle |
Compute Engine API | Firewallregeln |
Compute Engine API | Weiterleitungsregeln |
Compute Engine API | Globale extern verwaltete Backend-Dienste |
Compute Engine API | Globale extern verwaltete Weiterleitungsregeln |
Compute Engine API | Backend-Dienste von globalen externen Proxy-Load-Balancern |
Compute Engine API | Globale interne Traffic Director-Backend-Dienste |
Compute Engine API | GPU-Anzahl pro GPU-Familie |
Compute Engine API | GPUs (alle Regionen) |
Compute Engine API | Systemdiagnosen |
Compute Engine API | Bilder |
Compute Engine API | IP-Adressen in Verwendung |
Compute Engine API | In Verwendung befindliche regionale externe IPv4-Adressen |
Compute Engine API | Snapshot-Zeitpläne in Verwendung |
Compute Engine API | Instanzgruppen |
Compute Engine API | Instanzvorlagen |
Compute Engine API | Instanzen pro Peering-Gruppe |
Compute Engine API | Instanzen pro VPC-Netzwerk |
Compute Engine API | Interne IP-Adressen |
Compute Engine API | Back-End-Dienste des internen Passthrough-Netzwerk-Load-Balancers |
Compute Engine API | Weiterleitungsregeln für interne Passthrough-Network Load Balancer pro Peering-Gruppe |
Compute Engine API | Weiterleitungsregeln für interne Passthrough-Network-Load-Balancer pro VPC-Netzwerk |
Compute Engine API | IP-Aliasse pro Peering-Gruppe |
Compute Engine API | IP-Aliasse pro VPC-Netzwerk |
Compute Engine API | Lokales SSD-Laufwerk pro VM-Familie (GB) |
Compute Engine API | M1-CPUs |
Compute Engine API | M2-CPUs |
Compute Engine API | M3-CPUs |
Compute Engine API | Verwaltete Instanzgruppen |
Compute Engine API | N2-CPUs |
Compute Engine API | N2D-CPUs |
Compute Engine API | Netzwerk-Endpunktgruppen |
Compute Engine API | Netzwerk-Firewallrichtlinien |
Compute Engine API | Attribute von Regeln für Sicherheitsrichtlinien für Netzwerk-Load-Balancing |
Compute Engine API | Sicherheitsrichtlinien für das Netzwerk-Load-Balancing |
Compute Engine API | Netzwerke |
Compute Engine API | NVIDIA A2-CPUs |
Compute Engine API | Peerings pro VPC-Netzwerk |
Compute Engine API | Persistent Disk-IOPS |
Compute Engine API | Nichtflüchtiger SSD-Speicher (GB): |
Compute Engine API | Nichtflüchtiger Standardspeicher (GB) |
Compute Engine API | Präemptive CPUs |
Compute Engine API | Lokale SSD auf Abruf (GB) |
Compute Engine API | NVIDIA A100-GPUs mit 80 GB auf Abruf |
Compute Engine API | NVIDIA A100-GPUs auf Abruf |
Compute Engine API | NVIDIA H100-GPUs auf Abruf |
Compute Engine API | NVIDIA H100 MEGA-GPUs auf Abruf |
Compute Engine API | NVIDIA K80-GPUs auf Abruf |
Compute Engine API | NVIDIA L4-GPUs auf Abruf |
Compute Engine API | NVIDIA L4-GPUs auf Abruf für virtuelle Workstations |
Compute Engine API | NVIDIA P100-GPUs auf Abruf |
Compute Engine API | NVIDIA P100-GPUs auf Abruf für virtuelle Workstations |
Compute Engine API | NVIDIA P4-GPUs auf Abruf |
Compute Engine API | NVIDIA P4-GPUs auf Abruf für virtuelle Workstations |
Compute Engine API | NVIDIA T4-GPUs auf Abruf |
Compute Engine API | NVIDIA T4-GPUs auf Abruf für virtuelle Workstations |
Compute Engine API | NVIDIA V100-GPUs auf Abruf für virtuelle Workstations |
Compute Engine API | Öffentliche Beworbene Präfixe |
Compute Engine API | Regionale extern verwaltete Backend-Dienste |
Compute Engine API | Regionale extern verwaltete Weiterleitungsregeln pro Region und VPC-Netzwerk |
Compute Engine API | Regionale Instanzvorlagen |
Compute Engine API | Regionale intern verwaltete Backend-Dienste |
Compute Engine API | Regionale interne Traffic Director-Backend-Dienste |
Compute Engine API | Regional verwaltete Instanzgruppen |
Compute Engine API | Regionale Sicherheitsrichtlinien |
Compute Engine API | Regionale Regeln für Sicherheitsrichtlinien mit einer erweiterten Bedingung |
Compute Engine API | Regionale TCP-Zielproxys |
Compute Engine API | Router |
Compute Engine API | Routen |
Compute Engine API | Sicherheitsrichtlinien |
Compute Engine API | Regeln für Sicherheitsrichtlinien |
Compute Engine API | Sprachregeln für Regeln für Sicherheitsrichtlinien |
Compute Engine API | Snapshots |
Compute Engine API | SSL-Zertifikate |
Compute Engine API | Statische BYOIP-IP-Adressen |
Compute Engine API | Statische IP-Adressen |
Compute Engine API | Subnetzbereiche pro Peering-Gruppe |
Compute Engine API | Subnetzwerkbereiche pro VPC-Netzwerk |
Compute Engine API | T2A-CPUs |
Compute Engine API | T2D-CPUs |
Compute Engine API | Ziel-HTTP-Proxys |
Compute Engine API | Ziel-HTTPS-Proxys |
Compute Engine API | Ziel-SSL-Proxys |
Compute Engine API | Ziel-TCP-Proxys |
Compute Engine API | Ziel-VPN-Gateways |
Compute Engine API | Reservierter lokaler SSD-Speicher gesamt (GB) |
Compute Engine API | URL-Zuordnungen |
Compute Engine API | VM-Instanzen |
Compute Engine API | VPN-Gateways |
Compute Engine API | VPN-Tunnel |
Connect Gateway API | Gateway-Verbindungsanfragen pro Minute |
Dialogflow API | Alle anderen Anfragen pro Minute |
Filestore API | Sicherungen pro Region |
Filestore API | Kapazität von Basic HDD (Standard) (GB) nach Region |
Filestore API | Kapazität von Basic SSD (Premium) (GB) nach Region |
Filestore API | Zonale und regionale Kapazität (GB) von 1–10 TiB (Enterprise) pro Region |
Filestore API | Zonale und regionale Kapazität (High Scale) von 10–100 TiB (GB) pro Region |
Google Cloud Memorystore for Redis API | Redis-Gesamtkapazität (GB) pro Region |
Google Cloud Memorystore for Redis API | Gesamtzahl der Redis-Cluster-Einheiten pro Projekt und Region |
Memorystore API | Gesamtzahl der Memorystore-Einheiten pro Projekt und Region |
Vertex AI API | Benutzerdefinierte CPUs für die Bereitstellung von Modellen pro Region |
Vertex AI API | Bereitstellung von benutzerdefinierten Modellen mit Nvidia T4-GPUs pro Region |
Vertex AI API | Training von benutzerdefiniertem Modell mit Nvidia T4-GPUs pro Region |
Vertex AI API | Anfragen zum Generieren von Inhalten pro Minute und Projekt und Basismodell |
Vertex AI API | Regionale Anfragen für Onlinevorhersagen pro Minute und Projekt pro Basismodell Hinweis: Eine vollständige Liste der verfügbaren Dimensionen finden Sie in der Google Cloud -Konsole. |
Vertex AI API | Resource Management (CRUD)-Anfragen pro Minute und Region |
Vertex AI API | Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region |
Kontingentanpassung aktivieren
Zum Aktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:
cloudquotas.quotas.update
cloudquotas.quotas.get
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:
Konsole
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud Projekt in der Google Cloud Console:
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Konfigurationen.
- Klicken Sie auf den Schalter Aktivieren.
Wenn in der Spalte Status Aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung und sendet Anfragen zur Kontingentanpassung, wenn die Ressourcennutzung den Kontingentwert erreicht.
REST
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion): Senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld
enablement
aufENABLED
. Sie können auch ein ETag angeben. Das ist jedoch optional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
Ersetzen Sie Folgendes:
PROJECT_ID_OR_NUMBER
: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.OPTIONAL_ETAG
: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.
Dadurch wird der Aktivierungsstatus auf
enabled
aktualisiert.
gcloud
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt mit der gcloud CLI (Vorschau):
Authentifizieren Sie sich mit der gcloud CLI:
gcloud auth login
Einstellungen für die Kontingentanpassung aktivieren:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
Ersetzen Sie
PROJECT_ID_OR_NUMBER
durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.Prüfen Sie den Aktivierungsstatus:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als
enabled
zurückgegeben.
Anfragen zur Kontingentanpassung ansehen
Zum Aufrufen von Anfragen zur Kontingenterhöhung benötigen Sie die folgenden IAM-Berechtigungen:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
So rufen Sie Anfragen zur Kontingentanpassung auf, die von der Kontingentanpassung ausgegeben wurden:
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Anfragen erhöhen. In der Ansicht Anfragen erhöhen sehen Sie Erhöhungsanfragen für Ihr Projekt, einschließlich sowohl manuell angeforderter als auch durch die Kontingentanpassung erhöhter Kontingente.
- Klicken Sie auf das Feld Filter.
- Wählen Sie im Menü Typ aus und geben Sie
Auto
ein. Hier werden Anfragen gefiltert, die von der Kontingentanpassung gesendet wurden.
Benachrichtigungen zur Kontingentanpassung einrichten
So erhalten Sie Benachrichtigungen von der Kontingentanpassung:
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Konfigurationen.
- Klicken Sie auf Benachrichtigung erstellen.
- Wählen Sie eine oder beide Benachrichtigungsvorlagen aus:
- Alle Anpassungen durch die Kontingentanpassung senden jedes Mal eine Benachrichtigung, wenn die Kontingentanpassung eine Anfrage zur Kontingentanpassung für das Projekt ausgibt.
- Fehler und Störungen der Kontingentanpassung senden nur dann Benachrichtigungen, wenn die Kontingentanpassung versucht, ein Kontingentlimit zu erhöhen und dies nicht möglich ist.
- Optional: Sie können die Standardwerte für die Mindestdauer zwischen Benachrichtigungen und die Dauer bis zur automatischen Schließung von Vorfällen anpassen, indem Sie auf Optionen anzeigen klicken.
- Wählen Sie den Benachrichtigungskanal aus, über den Sie Benachrichtigungen erhalten möchten. Wenn Sie Ihre Einstellungen für den Benachrichtigungskanal anpassen oder einen neuen Benachrichtigungskanal erstellen möchten, klicken Sie auf Benachrichtigungskanäle verwalten.
- Klicken Sie auf Erstellen.
Benachrichtigungen zur Kontingentanpassung bearbeiten oder löschen
Sie können Benachrichtigungen zur Kontingentanpassung in derGoogle Cloud -Konsole bearbeiten oder löschen:
Rufen Sie in der Cloud Monitoring Console die Seite Richtlinien auf.
Suchen Sie nach der Benachrichtigungsrichtlinie für die Kontingentanpassung. Diese Richtlinien haben folgende Namen:
Quota adjuster errors and failures
All adjustments by quota adjuster
Klicken Sie in der Zeile mit der Benachrichtigungsrichtlinie für den Kontingentsmanager auf
Mehr anzeigen.Klicken Sie auf Bearbeiten oder Löschen.
Kontingentanpassung deaktivieren
Zum Deaktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:
cloudquotas.quotas.update
cloudquotas.quotas.get
So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:
Konsole
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Konfigurationen.
- Klicken Sie auf den Schalter Aktivieren. Der Schalter wird grau.
Wenn der Schalter grau ist und in der Statusspalte Nicht aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung nicht mehr und sendet keine Anfragen zur Kontingentanpassung mehr.
REST
Wenn Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion) deaktivieren möchten, senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld
enablement
aufDISABLED
. Sie können auch ein ETag angeben. Das ist jedoch optional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
Ersetzen Sie Folgendes:
PROJECT_ID_OR_NUMBER
: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.OPTIONAL_ETAG
: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.
Dadurch wird der Aktivierungsstatus auf
disabled
aktualisiert.
gcloud
So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud Projekt über die gcloud CLI (Vorabversion):
Authentifizieren Sie sich in der gcloud CLI:
gcloud auth login
So deaktivieren Sie die Einstellungen für die Kontingentanpassung:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
Ersetzen Sie
PROJECT_ID_OR_NUMBER
durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.Aktivierungsstatus prüfen:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als
disabled
zurückgegeben.
Fehlerbehebung bei Ablehnungen von Kontingenterhöhungen
Es kann vorkommen, dass eine durch die Kontingentanpassung initiierte Kontingenterhöhung abgelehnt wird. Dies kann vorkommen, wenn Google Cloud das Kontingentlimit für ein bestimmtes Projekt, eine Ressource oder eine Region nicht über ein bestimmtes Limit hinaus erhöhen kann. In diesen Fällen können Sie immer noch eine manuelle Kontingenterhöhung anfordern.
Wenn Sie benachrichtigt werden möchten, wenn ein Antrag auf Kontingentanpassung abgelehnt wird, richten Sie Benachrichtigungen zur Kontingentanpassung ein.