Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Informationen zu den Preisen für Cloud TPU finden Sie unter Cloud TPU-Preise.

Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.

Das Cloud-Kontingentsystem ermöglicht Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.

Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

TPU-Kontingent

TPU-Kontingente sind Limits für die Anzahl der Cloud TPU-Kerne, die Sie für einGoogle Cloud -Projekt verwenden können. Jede TPU-Version ist mit einem eigenen Kontingent verknüpft. Außerdem ist jedes Kontingent für eine Cloud TPU-Version in ein On-Demand-Kontingent und ein aufhebbares (oder Spot-)Kontingent unterteilt.

Wenn Sie Cloud TPU-Ressourcen erstellen, werden standardmäßig On-Demand-Ressourcen erstellt. Sie können über den Parameter --spot vorab änderbare Ressourcen erstellen, wenn Sie Ressourcen mit dem Befehl gcloud erstellen. Weitere Informationen finden Sie unter TPU-Ressourcen verwalten.

Standard-Cloud TPU-Kontingente

In den folgenden Tabellen sind die Standardwerte für On-Demand- und vorzeitig aufhebbares Kontingent für jede verfügbare Zone aufgeführt. Diese Werte geben die maximale Anzahl von TPU-Kernen an, die Sie in Ihrem Projekt verwenden können.

TPU-Version Standardkontingent (Anzahl der Kerne) Kontingentname
v6e 64 Kerne TPU v6e-Kerne auf Abruf pro Projekt und Zone
v5p 768 Kerne Auf Abruf verfügbare TPU v5p-Kerne pro Projekt und Zone
v5e 64 Kerne TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone
v4 0 Kerne TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone
v3-Pod 32 Kerne TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone
v3 120 Kerne TPU v3-Kerne auf Abruf pro Projekt und Zone
v2-Pod 32 Kerne TPU v2 auf Abruf – Pod-Kerne pro Projekt und Zone
v2 120 Kerne TPU v2 auf Abruf pro Projekt und Zone
TPU-Version Standardkontingent (Anzahl der Kerne) Kontingentname
v6e 32 Kerne TPU v6e-Kerne pro Projekt und Zone
v5p 128 Kerne TPU v5p-Kerne pro Projekt und Zone
v5e 32 Kerne TPU v5 Lite-Pod-Kerne pro Projekt und Zone
v4 0 Kerne TPU v4-Pod-Kerne pro Projekt und Zone
v3-Pod 32 Kerne TPU v3-Pod-Kerne pro Projekt und Zone
v3 40 Kerne TPU v3-Kerne pro Projekt und Zone
v2-Pod 32 Kerne TPU v2-Kerne pro Projekt und Zone
v2 40 Kerne TPU v2-Pod-Kerne pro Projekt und Zone

Zusätzliches Kontingent ansehen und anfordern

Das Ihrem Projekt zugewiesene Kontingent Google Cloud finden Sie in der Google Cloud Console auf der Seite Kontingente.

Auf der Seite Kontingente können Sie ein zusätzliches Cloud TPU-Kontingent anfordern. Suchen Sie das Kontingent, das Sie erhöhen möchten, klicken Sie auf das Dreipunkt-Menü und wählen Sie Kontingent bearbeiten aus. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern. Wenn Sie ein Kontingent anfordern, das unter dem Grenzwert für die automatische Genehmigung liegt, wird Ihre Anfrage automatisch genehmigt.

TPU-Version Grenzwert für die automatische Genehmigung Kontingentname
v6e Alle Zonen: 0 Kerne TPU v6e-Kerne auf Abruf pro Projekt und Zone
v5p Alle Zonen: 0 Kerne Auf Abruf verfügbare TPU v5p-Kerne pro Projekt und Zone
v5e
  • us-east5-b: 800 Kerne
  • us-west4-a: 1.600 Kerne
  • us-west4-b: 3.968 Kerne
  • us-west1-c: 576 Kerne
  • us-central1-a: 3.264 Kerne
  • europe-west4-a: 4.032 Kerne
TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone
v4 Alle Zonen: 0 Kerne TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone
v3-Pod
  • europe-west4-a: 512 Kerne
  • us-east1-d: 320 Kerne
TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone
v3
  • us-central1-a: 64 Kerne
  • europe-west4-a: 128 Kerne
TPU v3-Kerne auf Abruf pro Projekt und Zone
v2-Pod
  • us-central1-a: 64 Kerne
  • europe-west4-a: 64 Kerne
TPU v2 auf Abruf – Pod-Kerne pro Projekt und Zone
v2
  • us-central1-b: 128 Kerne
  • us-central1-c: 64 Kerne
  • us-central1-f: 128 Kerne
  • europe-west4-a: 32 Kerne
TPU v2 auf Abruf pro Projekt und Zone
TPU-Version Grenzwert für die automatische Genehmigung Kontingentname
v6e Alle Zonen: 0 Kerne TPU v6e-Kerne pro Projekt und Zone
v5p us-east5-a: 64 Kerne TPU v5p-Kerne pro Projekt und Zone
v5e Alle Zonen: 64 Kerne TPU v5 Lite-Pod-Kerne pro Projekt und Zone
v4 Alle Zonen: 0 Kerne TPU v4-Pod-Kerne pro Projekt und Zone
v3-Pod
  • europe-west4-a: 128 Kerne
  • us-east1-d: 64 Kerne
TPU v3-Pod-Kerne pro Projekt und Zone
v3
  • us-central1-a: 64 Kerne
  • europe-west4-a: 128 Kerne
TPU v3-Kerne pro Projekt und Zone
v2-Pod
  • us-central1-a: 64 Kerne
  • europe-west4-a: 64 Kerne
TPU v2-Kerne pro Projekt und Zone
v2
  • us-central1-b: 128 Kerne
  • us-central1-c: 64 Kerne
  • us-central1-f: 128 Kerne
  • europe-west4-a: 32 Kerne
TPU v2-Pod-Kerne pro Projekt und Zone

Sie erhalten eine E-Mail, in der Sie darüber informiert werden, ob Ihre Kontingentanfrage genehmigt oder abgelehnt wurde. Die Erhöhung desGoogle Cloud -Dienstkontingents erfolgt schrittweise. Dies kann zu laufenden Roll-outs in verschiedenen Regionen oder Ressourcen führen. Während des Roll-outs spiegelt der Kontingentwert, der in der Google Cloud Console oder der Cloud Quotas API angezeigt wird, nicht den neuen, erhöhten Kontingentwert wider, bis der Roll-out abgeschlossen ist. Weitere Informationen finden Sie unter Laufende Rollouts aufrufen.