Zuteilungskontingente


In diesem Dokument sind die Zuweisungskontingente aufgeführt, die für Compute Engine gelten.

Zuteilungskontingente

Zuordnungskontingente, auch als Ressourcenkontingente bezeichnet, definieren die Anzahl der Ressourcen, auf die Ihr Projekt Zugriff hat. Bei Compute Engine werden aus verschiedenen Gründen Zuteilungskontingente für die Ressourcennutzung erzwungen. Diese bieten unter anderem für die gesamte Google Cloud-Community eine Unterstützung für unvorhergesehene Auslastungsspitzen. Google Cloud bietet außerdem kostenlose Testkontingente, die einen eingeschränkten Zugriff für Projekte bieten, die zum Kennenlernen von Google Cloud im Rahmen einer kostenlosen Testversion dienen.

Es gelten nicht für alle Projekte dieselben Kontingente. Wenn Sie Google Cloud im Laufe der Zeit häufiger nutzen, können sich Ihre Kontingente entsprechend erhöhen. Falls Sie eine deutlich stärkere Auslastung erwarten, können Sie auf der Seite Kontingente der Google Cloud Console eine Anpassung Ihres Kontingents anfordern.

Informationen zu Kontingenten für die Ratenbegrenzungen für die Compute Engine API finden Sie unter API-Kontingente.

Kontingente und Ressourcenverfügbarkeit

Zuteilungskontingente legen die maximale Anzahl der Ressourcen eines bestimmten Typs fest, die Sie erstellen können, sofern diese Ressourcen verfügbar sind. Sie garantieren jedoch nicht, dass immer Ressourcen zur Verfügung stehen. Wenn eine Ressource nicht verfügbar ist oder Ihr Kontingent in der Region erschöpft ist, können Sie keine neuen Ressourcen dieses Typs erstellen. Das gilt auch, wenn Ihr Kontingent in der Region oder für das Projekt noch nicht erschöpft ist. Beispiel: Ihr Kontingent zum Erstellen externer IP-Adressen in us-central1 ist noch nicht aufgebraucht, aber in dieser Region sind keine IP-Adressen mehr verfügbar.

Es kann auch sein, dass Sie ein regionales Kontingent haben, eine Ressource aber in einer bestimmten Zone nicht verfügbar ist. Beispiel: Sie haben ein Kontingent zum Erstellen von VM-Instanzen in der Region us-central1, können aber keine VM-Instanzen in der Zone us-central1-a erstellen, wenn das Kontingent der Zone ausgeschöpft ist. Versuchen Sie in solchen Fällen, die jeweilige Ressource in einer anderen Zone zu erstellen, zum Beispiel in us-central1-f. Weitere Informationen zu Ihren Optionen bei erschöpften zonalen Ressourcen finden Sie in der Dokumentation zur Fehlerbehebung bei Ressourcenverfügbarkeit.

Zuteilungskontingente

Bei der Planung der Anforderungen von VM-Instanzen sollten Sie mehrere Kontingente nutzen, die sich darauf auswirken, wie viele VM-Instanzen Sie erstellen können.

Regionale und globale Kontingente

VM-Kontingente werden auf regionaler Ebene verwaltet. VM-Instanzen, Instanzgruppen, Laufwerkskontingente und CPU können von jeder VM in der Region unabhängig von der Zone genutzt werden. Das CPU-Kontingent ist beispielsweise ein regionales Kontingent, deshalb gilt für jede Region ein anderes Limit und eine andere Nutzungsanzahl. Sie benötigen ein Kontingent für mindestens 16 CPUs in us-central1, um eine Instanz vom Typ n2-standard-16 in einer beliebigen Zone der Region us-central1 zu starten.

Netzwerk- und Load-Balancing-Kontingente werden benötigt, um Firewalls, Load-Balancer, Netzwerke und VPNs zu erstellen. Dies sind globale Kontingente, die nicht von einer Region abhängig sind. Ein globales Kontingent kann von jeder Region genutzt werden. Beispielsweise verbrauchen genutzte und statische externe IP-Adressen, die Load-Balancern und HTTP(S)-Proxys zugewiesen sind, globale Kontingente.

VM-Instanzen

Das Kontingent für VM-Instanzen ist ein regionales Kontingent, mit dem die Anzahl der vorhandenen VM-Instanzen in einer bestimmten Region eingeschränkt wird, unabhängig davon, ob die VM ausgeführt wird. Dieses Kontingent wird in der Google Cloud Console auf der Seite Kontingente angezeigt. Das Kontingent wird von Compute Engine automatisch auf das 10-fache Ihres regulären CPU-Kontingents festgelegt. Sie brauchen dieses Kontingent nicht anzufordern. Wenn Sie ein Kontingent für weitere VM-Instanzen benötigen, sollten Sie zusätzliche CPUs anfordern. Mehr CPUs erhöhen auch das Kontingent für VM-Instanzen. Das Kontingent wird auf ausgeführte und auf nicht ausgeführte VMs sowie auf normale Instanzen und auf Instanzen auf Abruf angerechnet.

  1. Öffnen Sie in der Google Cloud Console die Seite Kontingente.

    Kontingente aufrufen

  2. Klicken Sie auf Tabelle filtern und wählen Sie Dienst aus.

  3. Wählen Sie Compute Engine API aus.

  4. Wählen Sie Kontingent: VM-Instanzen aus.

  5. Um eine Liste der VM-Instanzkontingente nach Region aufzurufen, klicken Sie auf Alle Kontingente. Ihre Kontingente für die einzelnen Regionen sind absteigend aufgeführt.

  6. Klicken Sie auf das Kästchen der Region, deren Kontingent Sie ändern möchten.

  7. Klicken Sie auf Kontingente bearbeiten.

  8. Füllen Sie es aus.

  9. Klicken Sie auf Antrag einreichen.

Instanzgruppen

Zum Verwenden von Instanzgruppen benötigen Sie ein verfügbares Kontingent für alle Ressourcen, die die Gruppe nutzt (beispielsweise ein CPU-Kontingent), sowie ein verfügbares Kontingent für die Gruppenressource selbst. Je nach dem Typ der von Ihnen erstellten Gruppe gelten folgende Gruppenkontingente für die Ressourcennutzung:

Diensttyp Dienstkontingent
Regional (mehrere Zonen) verwaltete Instanzgruppe Regional instance group managers
Zonal (einzelne Zone) verwaltete Instanzgruppe Beide:
  • Instance group managers
  • Instance groups
Nicht verwaltete (einzelne Zone) Instanzgruppe Instance groups
Regionales (mehrere Zonen) Autoscaling Regional autoscalers
Zonales (einzelne Zone) Autoscaling Autoscalers

Laufwerkskontingente

Die folgenden Kontingente für nichtflüchtigen Speicher und lokale SSDs gelten je Region:

  • Local SSD per machine family (GB). Dieses Kontingent entspricht der Gesamtgröße der lokalen SSD-Partitionen, die Sie in einer Region basierend auf dem Maschinentyp der einzelnen VMs an VMs anhängen können. Eine lokale SSD ist ein schnelles, flüchtiges Laufwerk, das für Scratch-Jobs, den lokalen Cache oder Verarbeitungsjobs mit einer hohen Fehlertoleranz genutzt werden kann, da der Inhalt dieses Laufwerks nach dem Neustart einer VM-Instanz nicht mehr verfügbar ist. Lokale SSD-Partitionen werden in Schritten von 375 GB verkauft. Es können bis zu 24 lokale SSD-Partitionen an eine VM angehängt werden. In der gcloud CLI und der API wird dieses Kontingent LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY genannt.

  • Persistent disk standard (GB): Dieses Kontingent ist die Gesamtgröße der nichtflüchtigen Standardspeicher, die in einer Region erstellt werden können. Wie unter Leistung von nichtflüchtigen Speichern und lokalen SSDs optimieren gezeigt, bieten nichtflüchtige Standardspeicher weniger IOPS und Durchsatz als nichtflüchtige SSD-Speicher oder lokale SSDs. Sie können jedoch kostengünstig als große langlebige Laufwerke für Speicher, als Bootlaufwerke sowie für serielle Schreibvorgänge wie Logs eingesetzt werden. Nichtflüchtige Standardspeicher sind langlebig und können in unbegrenzter Zahl an eine VM in einer Zone angehängt werden. In der gcloud CLI und der API wird dieses Kontingent DISKS_TOTAL_GB genannt. Dieses Kontingent gilt auch für regionale nichtflüchtige Standardspeicher. Regionale Laufwerke verbrauchen jedoch pro GB doppelt so viel vom Kontingent, weil sie innerhalb einer Region in zwei Zonen repliziert werden.

  • Persistent disk SSD (GB): Dieses Kontingent ist die kombinierte Gesamtgröße der Partitionen SSD-gestützter nichtflüchtiger Speicher, die in einer Region erstellt werden können. SSD-gestützte nichtflüchtige Speicher umfassen mehrere Replikate und bieten mehr IOPS sowie einen höheren Durchsatz als nichtflüchtige Standardspeicher, wie unter Blockspeicherleistung erläutert. SSD-gestützte nichtflüchtige Speicher stehen in unbegrenzter Zahl zum Anhängen an eine VM innerhalb einer Zone zur Verfügung. In der gcloud CLI und der API wird dieses Kontingent SSD_TOTAL_GB genannt. Dieses Kontingent ist vom lokalen SSD-Kontingent getrennt. Dieses Kontingent gilt für die folgenden Laufwerkstypen:

    • Zonaler und regionaler nichtflüchtiger SSD-Speicher
    • Abgestimmter zonaler und regionaler nichtflüchtiger Speicher

    Regionale nichtflüchtige Speicher verbrauchen pro GB doppelt so viel vom Kontingent, weil sie innerhalb einer Region in zwei Zonen repliziert werden.

CPU-Kontingentlimits

Das CPU-Kontingent bezieht sich auf die Gesamtzahl der virtuellen CPUs in Ihren VM-Instanzen in einer Region. CPU-Kontingente gelten für ausgeführte VMs und VM-Reservierungen. Sowohl vordefinierte VMs als auch VMs auf Abruf nutzen dieses Kontingent.

Zum Schutz der Compute Engine-Systeme und anderer Nutzer haben einige neue Konten und Projekte auch ein globales CPUs (All Regions)-Kontingent. Dieses gilt regionenübergreifend und wird als Gesamtzahl Ihrer vCPUs in allen Regionen berechnet.

Wenn Sie beispielsweise in einer Region (z. B. us-central1) noch 48 vCPUs, aber für das Kontingent CPUs (All Regions) nur 32 vCPUs haben, können Sie in der Region us-central1 trotz des verbleibenden Kontingents nur 32 vCPUs starten. Das liegt daran, dass das Kontingent CPU (All Regions) ausgeschöpft wurde. Sie müssen vorhandene Instanzen löschen, um neue Instanzen starten zu können.

E2- und N1-Maschinentypen nutzen gemeinsam einen CPU-Kontingentpool. Wenn nicht anders angegeben, haben alle anderen Maschinentypen eindeutige, separate CPU-Kontingentpools.

Wenn Sie Rabatte für zugesicherte Nutzung für Ihre VMs verwenden, müssen Sie ein Rabattkontingent für zugesicherte Nutzung haben, bevor Sie einen Rabatt für zugesicherte Nutzung erwerben.

Maschinentyp Kontingentpool Name des CPU-Kontingents Name des zugesicherten CPU-Kontingents
N1 Gemeinsam genutzter Pool CPUS Committed_CPUS
E2 Gemeinsam genutzter Pool CPUS Committed_E2_CPUS
N2 Separater Pool N2_CPUS Committed_N2_CPUS
N2D Separater Pool N2D_CPUS Committed_N2D_CPUS
T2D Separater Pool T2D_CPUS Committed_T2D_CPUS
T2A Separater Pool T2A_CPUS Nicht verfügbar (N/V) für T2A
Z3 (Vorschau) Separater Pool CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 Separater Pool M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 Separater Pool M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 Separater Pool M3_CPUS Committed_M3_CPUS
H3 Separater Pool CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 Separater Pool C2_CPUS Committed_C2_CPUS
C2D Separater Pool C2D_CPUS Committed_C2D_CPUS
C3 Separater Pool C3_CPUS Committed_C3_CPUS
C3D Separater Pool CPUS_PER_VM_FAMILY Committed_C3D_CPUS
VMs auf Abruf Gemeinsam genutzter Pool PREEMPTIBLE_CPUS Nicht verfügbar (N/V) für VMs auf Abruf

GPU-Kontingent

Wie das CPU-Kontingent bezieht sich auch das GPU-Kontingent auf die Gesamtzahl der virtuellen GPUs in allen VM-Instanzen in einer Region. GPU-Kontingente gelten für ausgeführte VMs und VM-Reservierungen. Sowohl vordefinierte VMs als auch VMs auf Abruf nutzen dieses Kontingent.

Prüfen Sie auf der Seite Kontingente, ob in Ihrem Projekt ausreichend GPUs zur Verfügung stehen, und fordern Sie gegebenenfalls ein höheres Kontingent an. Neue Konten und Projekte haben außerdem ein globales GPU-Kontingent, das für alle Regionen gilt.

Wenn Sie ein GPU-Kontingent anfordern, müssen Sie ein Kontingent für die GPU-Modelle, die Sie in den einzelnen Regionen erstellen möchten, sowie ein zusätzliches globales Kontingent (GPUs (all regions)) für die Gesamtzahl der GPUs aller Typen in allen Regionen anfordern. Fordern Sie für die Verwendung dieser Ressourcen ein GPU-Kontingent auf Abruf an.

NVIDIA Name des GPU-Kontingents Name des zugesicherten GPU-Kontingents Virtuelle Workstation GPUs auf Abruf GPU auf Abruf für Workstations
H100 80GB NVIDIA_H100_GPUS COMMITTED_NVIDIA_H100_GPUS PREEMPTIBLE_NVIDIA_H100_GPUS
A100 40GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS PREEMPTIBLE_NVIDIA_A100_GPUS
A100 80GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS PREEMPTIBLE_NVIDIA_A100_80GB_GPUS
L4 NVIDIA_L4_GPUS COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS PREEMPTIBLE_NVIDIA_V100_GPUS
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS PREEMPTIBLE_NVIDIA_K80_GPUS

Zuweisungskontingente für Ressourcen auf Abruf

Sie müssen in Ihrem Projekt für die jeweiligen Ressourcen ein Kontingent haben, um CPUs auf Abruf oder an VM-Instanzen auf Abruf angehängte GPUs bzw. lokale SSDs zu verwenden.

Sie können für Preemptible CPUs, Preemptible GPUs oder Preemptible Local SSDs (GB) spezielle Kontingente auf Abruf anfordern. Wenn Ihr Projekt jedoch kein Kontingent auf Abruf hat und Sie kein Kontingent auf Abruf angefordert haben, können Sie das Standardkontingent zum Starten von Ressourcen auf Abruf verwenden.

Nachdem Ihnen von Compute Engine ein Kontingent auf Abruf in einer Region zugeteilt wurde, werden alle Instanzen auf Abruf automatisch auf das Auf-Abruf-Kontingent angerechnet. Da dieses Kontingent ausgeschöpft ist, müssen Sie für diese Ressourcen ein Kontingent auf Abruf anfordern.

Externe IP-Adressen

Sie benötigen eine ausreichende Anzahl an externen IP-Adressen für jede VM, die über das öffentliche Internet erreichbar sein muss. Das regionale IP-Kontingent gilt für die Zuweisung von IPv4-Adressen zu VMs in dieser Region. Das globale IP-Kontingent gilt für die Zuweisung von IPv4-Adressen an globale Netzwerkressourcen wie Load-Balancer. Google Cloud bietet passend zu Ihren Anforderungen verschiedene Arten von IP-Adressen an. Weitere Informationen zu Preisen finden Sie unter Preise für externe IP-Adressen. Ausführliche Informationen zu Kontingenten finden Sie unter Kontingente und Limits.

  • Verwendete externe IP-Adressen: Diese umfassen sitzungsspezifische und statische IP-Adressen, die aktuell von einer Ressource verwendet werden.

  • Statische externe IP-Adressen: Externe IP-Adressen, die für Ihre Ressourcen reserviert wurden und auch nach dem Neustart einer Maschine beibehalten werden. Sie können diese Adressen bei DNS- und Domainanbietern registrieren, um eine nutzerfreundliche Adresse zu erhalten, beispielsweise www.example-site.com.

  • Statische interne IP-Adressen: Mit statischen internen IP-Adressen können Sie interne IP-Adressen aus dem im Subnetz konfigurierten internen IP-Bereich reservieren. Diesen reservierten internen Adressen können Sie nach Bedarf Ressourcen zuordnen.

Kontingent-Roll-outs

Gelegentlich ändert Google Cloud das Standardkontingent für Ressourcen und APIs. Diese Änderungen werden schrittweise vorgenommen. Während der Einführung eines neuen Standardkontingents spiegelt das maximale Kontingent in der Google Cloud Console möglicherweise nicht das tatsächliche maximale Kontingent wider, das Ihnen zur Verfügung steht.

Angenommen, Google Cloud ändert das standardmäßige maximale Kontingent für Firewallregeln von 200 in 300. Wenn Sie Ihr Kontingent mit der Google Cloud Console ansehen, kann das neue Kontingent von 300angezeigt werden, obwohl Ihr tatsächliches Kontingent 200 ist, bis der Roll-out abgeschlossen ist.

Informationen zu laufenden Kontingenteinführungen finden Sie unter Bekannte Probleme. Wenn keine Probleme beschrieben werden, werden keine Kontingent-Roll-outs ausgeführt.

Wenn ein Kontingent-Roll-out läuft und Sie das tatsächliche maximale Kontingent bestätigen möchten, das Ihnen zur Verfügung steht, prüfen Sie Ihr Kontingent über die Google Cloud CLI. Wenn Sie ein größeres Kontingent benötigen, als Sie Zugriff haben, senden Sie eine Anfrage zur Kontingenterhöhung.

Nächste Schritte