Kontingentanpassung

In diesem Dokument wird beschrieben, wie Sie Kontingente mithilfe des Kontingentanpassungssystems anpassen.

Die Kontingentanpassung beobachtet Ihren Ressourcenverbrauch und sendet proaktiv Anfragen zur Kontingentanpassung in Ihrem Namen. Wenn Sie Ihre Ressourcennutzung im Blick behalten und proaktiv Anträge auf Kontingentanpassung stellen, können Sie Ausfälle vermeiden, die durch das Erreichen Ihres Kontingentwerts verursacht werden. Mit der Kontingentanpassung müssen Sie weniger auf ungeplante Steigerungen der Ressourcennutzung achten und können weniger manuelle Anträge auf Kontingentanpassungen stellen.

Funktionsweise der Kontingentanpassung

Wenn Sie die Kontingentanpassung aktivieren, werden alle anwendbaren Kontingente überwacht und die folgende Logik wird angewendet:

  • Die Kontingentanpassung prüft, ob die Spitzennutzung während eines bestimmten Zeitraums das Kontingentwert erreicht hat.
  • Wenn ja, versucht die Kontingentanpassung, das Kontingentlimit zu erhöhen (in der Regel etwa 10 bis 20 %).

Wenn es möglich ist, den Kontingentwert zu erhöhen, wird die Erhöhung genehmigt und der Wert angepasst. Sie können jederzeit manuell Erhöhungen für Kontingentwerte anfordern, unabhängig davon, ob die Kontingentanpassung aktiviert ist oder nicht.

Die Kontingentanpassung sendet nur Anfragen zur Kontingentanpassung, um den Wert eines Kontingents zu erhöhen. Es wird nicht versucht, den Wert zu senken. Für Kontingente mit einer manuellen Kontingentobergrenze werden keine Anfragen zur Kontingentanpassung eingereicht.

Sie können Anfragen, die von der Kontingentanpassung gesendet wurden, in derGoogle Cloud Console auf der Seite „Kontingente und Systemlimits“ einsehen. Sie können auch Benachrichtigungen einrichten, um Änderungen zu überwachen, die durch die Kontingentanpassung initiiert wurden.

Beschränkungen

Für die Kontingentanpassung gelten die folgenden Einschränkungen:

  • Die Einstellungen für die Kontingentanpassung sind nur auf Projektbasis verfügbar.
  • Die Einstellungen für die Kontingentanpassung sind nur über dieGoogle Cloud -Konsole zugänglich.
  • Der Kontingent-Adjuster ist nicht für alle Kontingente verfügbar. Weitere Informationen finden Sie in diesem Dokument unter Verfügbarkeit.

Verfügbarkeit

Die Verfügbarkeit der Kontingentanpassung hängt von Ihrem Google Cloud Projekt ab und ist nur für einige Google Cloud Kontingente verfügbar.

Anspruch basierend auf dem Nutzungsverlauf

Für die Kontingentanpassung ist eine ausreichende Menge an Verlaufsdaten zur Nutzung erforderlich, um genau bestimmen zu können, wann zusätzliche Kontingente angefordert werden sollen. Aus diesem Grund ist die Option zur Aktivierung der Kontingentanpassung nur für Projekte mit ausreichend früheren Aktivitäten verfügbar, um genaue Vorhersagen zu unterstützen.

Unterstützte Kontingente

Die Kontingentanpassung ist nicht für alleGoogle Cloud -Kontingente verfügbar. Ein Google Cloud -Dienst unterstützt den Kontingent-Adjuster möglicherweise für alle, einige oder keine seiner Kontingente. Wenn Sie die Kontingentanpassung für Ihr Projekt aktivieren, wird sie auf alle unterstützten Kontingente angewendet.

Wenn ein Google Cloud -Dienst die Unterstützung der Kontingentanpassung für seine Kontingente hinzufügt oder erweitert, überwacht und passt die Kontingentanpassung diese neu unterstützten Kontingente automatisch für Ihr Projekt an. Das passiert auch dann, wenn diese spezifischen Kontingente nicht unterstützt wurden, als Sie den Kontingent-Adjuster ursprünglich aktiviert haben.

In der folgenden Tabelle sind die Kontingente aufgeführt, die vom Kontingent-Tool unterstützt werden.

Dienst Kontingente
Artifact Registry API Anfragen pro Projekt in der Multi-Region „Asien“ pro Minute
Artifact Registry API Anfragen pro Projekt in der Mehrfachregion Europa pro Minute
Artifact Registry API Anfragen pro Projekt in der US-Mehrfachregion pro Minute
Artifact Registry API Anfragen pro Projekt pro Region und Minute pro Region
Cloud Build API Build- und Operation-Get-Anfragen pro Minute
Cloud Build API Build- und Operation-Get-Anfragen pro Minute und Nutzer
Cloud Build API Gleichzeitige Build-CPUs (regionaler Standardpool)
Cloud Build API Gleichzeitige Builds (nicht regionaler Standardpool)
Cloud Key Management Service API Kryptografische Anfragen pro Minute
Cloud Key Management Service API Leseanfragen pro Minute
Cloud Key Management Service API Schreibanfragen pro Minute
Cloud Logging API Geschriebene Log-Byte pro Minute und Region
Cloud Resource Manager API Leseanfragen pro Minute
Cloud Run Admin API Anfragen für Jobausführungen pro Minute und Region
Cloud Run Admin API Leseanfragen pro Minute und Region
Cloud Run Admin API Gesamte CPU-Zuweisung in Milli-vCPUs pro Projekt und Region
Cloud Run Admin API Leseanfragen pro Minute und Region
Cloud Trace API Schreibanfragen (kostenlos) pro Minute
Compute Engine API Affinitätsgruppen
Compute Engine API Backend-Buckets
Compute Engine API C2-CPUs
Compute Engine API C2D-CPUs
Compute Engine API C3-CPUs
Compute Engine API Zusicherungen
Compute Engine API Zugesicherte A2-CPUs
Compute Engine API Zugesicherte CPUs
Compute Engine API Vergebene Lizenzen
Compute Engine API Reservierter zugesicherter lokaler SSD-Speicherplatz (GB)
Compute Engine API Zugesicherte M3-CPUs
Compute Engine API Zugesicherte speicheroptimierte CPUs
Compute Engine API Zugesicherte N2-CPUs
Compute Engine API Zugesicherte N2D-CPUs
Compute Engine API Zugesicherte T2D-CPUs
Compute Engine API CPUs
Compute Engine API CPUs pro VM-Familie
Compute Engine API Projekte mit projektübergreifendem Netzwerkdienst
Compute Engine API Benutzerdefinierte statische Routen pro VPC-Netzwerk
Compute Engine API Externe Passthrough-Back-End-Dienste des Netzwerk-Load-Balancers
Compute Engine API Weiterleitungsregeln für externe Passthrough-Network-Load-Balancer
Compute Engine API Weiterleitungsregeln für externe Protokolle
Compute Engine API Firewallregeln
Compute Engine API Weiterleitungsregeln
Compute Engine API Globale extern verwaltete Backend-Dienste
Compute Engine API Globale extern verwaltete Weiterleitungsregeln
Compute Engine API Backend-Dienste von globalen externen Proxy-Load-Balancern
Compute Engine API Globale interne Traffic Director-Backend-Dienste
Compute Engine API GPU-Anzahl pro GPU-Familie
Compute Engine API GPUs (alle Regionen)
Compute Engine API Systemdiagnosen
Compute Engine API Bilder
Compute Engine API IP-Adressen in Verwendung
Compute Engine API In Verwendung befindliche regionale externe IPv4-Adressen
Compute Engine API Snapshot-Zeitpläne in Verwendung
Compute Engine API Instanzgruppen
Compute Engine API Instanzvorlagen
Compute Engine API Instanzen pro Peering-Gruppe
Compute Engine API Instanzen pro VPC-Netzwerk
Compute Engine API Interne IP-Adressen
Compute Engine API Back-End-Dienste des internen Passthrough-Netzwerk-Load-Balancers
Compute Engine API Weiterleitungsregeln für interne Passthrough-Network Load Balancer pro Peering-Gruppe
Compute Engine API Weiterleitungsregeln für interne Passthrough-Network-Load-Balancer pro VPC-Netzwerk
Compute Engine API IP-Aliasse pro Peering-Gruppe
Compute Engine API IP-Aliasse pro VPC-Netzwerk
Compute Engine API Lokales SSD-Laufwerk pro VM-Familie (GB)
Compute Engine API M1-CPUs
Compute Engine API M2-CPUs
Compute Engine API M3-CPUs
Compute Engine API Verwaltete Instanzgruppen
Compute Engine API N2-CPUs
Compute Engine API N2D-CPUs
Compute Engine API Netzwerk-Endpunktgruppen
Compute Engine API Netzwerk-Firewallrichtlinien
Compute Engine API Attribute von Regeln für Sicherheitsrichtlinien für Netzwerk-Load-Balancing
Compute Engine API Sicherheitsrichtlinien für das Netzwerk-Load-Balancing
Compute Engine API Netzwerke
Compute Engine API NVIDIA A2-CPUs
Compute Engine API Peerings pro VPC-Netzwerk
Compute Engine API Persistent Disk-IOPS
Compute Engine API Nichtflüchtiger SSD-Speicher (GB):
Compute Engine API Nichtflüchtiger Standardspeicher (GB)
Compute Engine API Präemptive CPUs
Compute Engine API Lokale SSD auf Abruf (GB)
Compute Engine API NVIDIA A100-GPUs mit 80 GB auf Abruf
Compute Engine API NVIDIA A100-GPUs auf Abruf
Compute Engine API NVIDIA H100-GPUs auf Abruf
Compute Engine API NVIDIA H100 MEGA-GPUs auf Abruf
Compute Engine API NVIDIA K80-GPUs auf Abruf
Compute Engine API NVIDIA L4-GPUs auf Abruf
Compute Engine API NVIDIA L4-GPUs auf Abruf für virtuelle Workstations
Compute Engine API NVIDIA P100-GPUs auf Abruf
Compute Engine API NVIDIA P100-GPUs auf Abruf für virtuelle Workstations
Compute Engine API NVIDIA P4-GPUs auf Abruf
Compute Engine API NVIDIA P4-GPUs auf Abruf für virtuelle Workstations
Compute Engine API NVIDIA T4-GPUs auf Abruf
Compute Engine API NVIDIA T4-GPUs auf Abruf für virtuelle Workstations
Compute Engine API NVIDIA V100-GPUs auf Abruf für virtuelle Workstations
Compute Engine API Öffentliche Beworbene Präfixe
Compute Engine API Regionale extern verwaltete Backend-Dienste
Compute Engine API Regionale extern verwaltete Weiterleitungsregeln pro Region und VPC-Netzwerk
Compute Engine API Regionale Instanzvorlagen
Compute Engine API Regionale intern verwaltete Backend-Dienste
Compute Engine API Regionale interne Traffic Director-Backend-Dienste
Compute Engine API Regional verwaltete Instanzgruppen
Compute Engine API Regionale Sicherheitsrichtlinien
Compute Engine API Regionale Regeln für Sicherheitsrichtlinien mit einer erweiterten Bedingung
Compute Engine API Regionale TCP-Zielproxys
Compute Engine API Router
Compute Engine API Routen
Compute Engine API Sicherheitsrichtlinien
Compute Engine API Regeln für Sicherheitsrichtlinien
Compute Engine API Sprachregeln für Regeln für Sicherheitsrichtlinien
Compute Engine API Snapshots
Compute Engine API SSL-Zertifikate
Compute Engine API Statische BYOIP-IP-Adressen
Compute Engine API Statische IP-Adressen
Compute Engine API Subnetzbereiche pro Peering-Gruppe
Compute Engine API Subnetzwerkbereiche pro VPC-Netzwerk
Compute Engine API T2A-CPUs
Compute Engine API T2D-CPUs
Compute Engine API Ziel-HTTP-Proxys
Compute Engine API Ziel-HTTPS-Proxys
Compute Engine API Ziel-SSL-Proxys
Compute Engine API Ziel-TCP-Proxys
Compute Engine API Ziel-VPN-Gateways
Compute Engine API Reservierter lokaler SSD-Speicher gesamt (GB)
Compute Engine API URL-Zuordnungen
Compute Engine API VM-Instanzen
Compute Engine API VPN-Gateways
Compute Engine API VPN-Tunnel
Connect Gateway API Gateway-Verbindungsanfragen pro Minute
Dialogflow API Alle anderen Anfragen pro Minute
Filestore API Sicherungen pro Region
Filestore API Kapazität von Basic HDD (Standard) (GB) nach Region
Filestore API Kapazität von Basic SSD (Premium) (GB) nach Region
Filestore API Zonale und regionale Kapazität (GB) von 1–10 TiB (Enterprise) pro Region
Filestore API Zonale und regionale Kapazität (High Scale) von 10–100 TiB (GB) pro Region
Google Cloud Memorystore for Redis API Redis-Gesamtkapazität (GB) pro Region
Google Cloud Memorystore for Redis API Gesamtzahl der Redis-Cluster-Einheiten pro Projekt und Region
Memorystore API Gesamtzahl der Memorystore-Einheiten pro Projekt und Region
Vertex AI API Benutzerdefinierte CPUs für die Bereitstellung von Modellen pro Region
Vertex AI API Bereitstellung von benutzerdefinierten Modellen mit Nvidia T4-GPUs pro Region
Vertex AI API Training von benutzerdefiniertem Modell mit Nvidia T4-GPUs pro Region
Vertex AI API Anfragen zum Generieren von Inhalten pro Minute und Projekt und Basismodell
Vertex AI API

Regionale Anfragen für Onlinevorhersagen pro Minute und Projekt pro Basismodell

Hinweis: Eine vollständige Liste der verfügbaren Dimensionen finden Sie in der Google Cloud -Konsole.

Vertex AI API Resource Management (CRUD)-Anfragen pro Minute und Region
Vertex AI API Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region

Kontingentanpassung aktivieren

Zum Aktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:

Konsole

So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud Projekt in der Google Cloud Console:

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen.
  3. Klicken Sie auf den Schalter Aktivieren.

Wenn in der Spalte Status Aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung und sendet Anfragen zur Kontingentanpassung, wenn die Ressourcennutzung den Kontingentwert erreicht.

REST

  1. So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion): Senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld enablement auf ENABLED. Sie können auch ein ETag angeben. Das ist jedoch optional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.
    • OPTIONAL_ETAG: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.

    Dadurch wird der Aktivierungsstatus auf enabled aktualisiert.

gcloud

So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt mit der gcloud CLI (Vorschau):

  1. Authentifizieren Sie sich mit der gcloud CLI:

    gcloud auth login
    
  2. Einstellungen für die Kontingentanpassung aktivieren:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Ersetzen Sie PROJECT_ID_OR_NUMBER durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.

  3. Prüfen Sie den Aktivierungsstatus:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als enabled zurückgegeben.

Anfragen zur Kontingentanpassung ansehen

Zum Aufrufen von Anfragen zur Kontingenterhöhung benötigen Sie die folgenden IAM-Berechtigungen:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

So rufen Sie Anfragen zur Kontingentanpassung auf, die von der Kontingentanpassung ausgegeben wurden:

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Anfragen erhöhen. In der Ansicht Anfragen erhöhen sehen Sie Erhöhungsanfragen für Ihr Projekt, einschließlich sowohl manuell angeforderter als auch durch die Kontingentanpassung erhöhter Kontingente.
  3. Klicken Sie auf das Feld Filter.
  4. Wählen Sie im Menü Typ aus und geben Sie Auto ein. Hier werden Anfragen gefiltert, die von der Kontingentanpassung gesendet wurden.

Benachrichtigungen zur Kontingentanpassung einrichten

So erhalten Sie Benachrichtigungen von der Kontingentanpassung:

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen.
  3. Klicken Sie auf Benachrichtigung erstellen.
  4. Wählen Sie eine oder beide Benachrichtigungsvorlagen aus:
    1. Alle Anpassungen durch die Kontingentanpassung senden jedes Mal eine Benachrichtigung, wenn die Kontingentanpassung eine Anfrage zur Kontingentanpassung für das Projekt ausgibt.
    2. Fehler und Störungen der Kontingentanpassung senden nur dann Benachrichtigungen, wenn die Kontingentanpassung versucht, ein Kontingentlimit zu erhöhen und dies nicht möglich ist.
  5. Optional: Sie können die Standardwerte für die Mindestdauer zwischen Benachrichtigungen und die Dauer bis zur automatischen Schließung von Vorfällen anpassen, indem Sie auf Optionen anzeigen klicken.
  6. Wählen Sie den Benachrichtigungskanal aus, über den Sie Benachrichtigungen erhalten möchten. Wenn Sie Ihre Einstellungen für den Benachrichtigungskanal anpassen oder einen neuen Benachrichtigungskanal erstellen möchten, klicken Sie auf Benachrichtigungskanäle verwalten.
  7. Klicken Sie auf Erstellen.

Benachrichtigungen zur Kontingentanpassung bearbeiten oder löschen

Sie können Benachrichtigungen zur Kontingentanpassung in derGoogle Cloud -Konsole bearbeiten oder löschen:

  1. Rufen Sie in der Cloud Monitoring Console die Seite Richtlinien auf.

    Zu den Richtlinien

  2. Suchen Sie nach der Benachrichtigungsrichtlinie für die Kontingentanpassung. Diese Richtlinien haben folgende Namen:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Klicken Sie in der Zeile mit der Benachrichtigungsrichtlinie für den Kontingentsmanager auf Mehr anzeigen.

  4. Klicken Sie auf Bearbeiten oder Löschen.

Kontingentanpassung deaktivieren

Zum Deaktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:

Konsole

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen.
  3. Klicken Sie auf den Schalter Aktivieren. Der Schalter wird grau.

Wenn der Schalter grau ist und in der Statusspalte Nicht aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung nicht mehr und sendet keine Anfragen zur Kontingentanpassung mehr.

REST

  1. Wenn Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion) deaktivieren möchten, senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld enablement auf DISABLED. Sie können auch ein ETag angeben. Das ist jedoch optional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.
    • OPTIONAL_ETAG: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.

    Dadurch wird der Aktivierungsstatus auf disabled aktualisiert.

gcloud

So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud Projekt über die gcloud CLI (Vorabversion):

  1. Authentifizieren Sie sich in der gcloud CLI:

    gcloud auth login
    
  2. So deaktivieren Sie die Einstellungen für die Kontingentanpassung:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Ersetzen Sie PROJECT_ID_OR_NUMBER durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.

  3. Aktivierungsstatus prüfen:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als disabled zurückgegeben.

Fehlerbehebung bei Ablehnungen von Kontingenterhöhungen

Es kann vorkommen, dass eine durch die Kontingentanpassung initiierte Kontingenterhöhung abgelehnt wird. Dies kann vorkommen, wenn Google Cloud das Kontingentlimit für ein bestimmtes Projekt, eine Ressource oder eine Region nicht über ein bestimmtes Limit hinaus erhöhen kann. In diesen Fällen können Sie immer noch eine manuelle Kontingenterhöhung anfordern.

Wenn Sie benachrichtigt werden möchten, wenn ein Antrag auf Kontingentanpassung abgelehnt wird, richten Sie Benachrichtigungen zur Kontingentanpassung ein.