Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Weitere Informationen Informationen zu Cloud TPU-Preisen finden Sie unter Cloud TPU-Preise.

Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.

Das Cloud-Kontingentsystem ermöglicht Folgendes:

  • Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
  • Ihren Verbrauch dieser Ressourcen einschränken
  • Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.

Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

TPU-Kontingent

Für jede TPU-Version gibt es unterschiedliche Kontingente. Zum Beispiel gibt es verschiedene Kontingente für TPU v2, v3 usw. Für jede TPU-Version gibt es verschiedene Kontingentarten: On-Demand und auf Abruf (Spot-VMs). In der folgenden Tabelle werden die verschiedenen Kontingentarten beschrieben.

Kontingenttyp Beschreibung Standardwert Anfrage senden Flags für die TPU-Erstellung
On demand Die Anzahl der On-Demand-Ressourcen, auf die Sie Zugriff haben. On demand Ressourcen werden nicht vorzeitig beendet, aber das On-Demand-Kontingent garantiert dies nicht. genügend Cloud TPU-Ressourcen zur Verfügung, um Ihre Anfrage zu erfüllen. v3-8 und v2-8: 16 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. Keine Markierungen erforderlich, standardmäßig ausgewählt.
Auf Abruf Die Anzahl der Cloud TPU-Ressourcen auf Abruf, auf die Sie Zugriff haben. Dieses Kontingent gilt sowohl für TPUs auf Abruf als auch für TPU-Spot-VMs. Ressourcen auf Abruf können vorzeitig beendet werden, um Platz für höhere Priorität zu schaffen Jobs. Das präemptive Kontingent garantiert nicht, dass genügend verfügbar ist Cloud TPU-Ressourcen, um Ihre Anfrage zu erfüllen. Weitere Informationen finden Sie unter Präemptive TPUs und TPU-Spot-VMs verwalten. v3-8 und v2-8: 48 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern.
  • Spot-VMs: Verwenden Sie die Methode --spot.
  • Präemptive TPUs: Verwenden Sie die Methode --preemptible. Das --preemptible Flag wird nicht unterstützt für queued Ressourcen. Verwenden Sie stattdessen das Flag --spot.

TPU-Kontingente werden in Form von TPU-Kernen pro Projekt und Zone oder als TPU-Kerne angegeben pro Projekt und Region.

TPU v5p-Kontingente

Sie können Ihr TPU-v5p-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v5p-Kerne auf Abruf pro Projekt und Region
  • TPU v5p-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v5p-Kerne pro Projekt und Region
  • TPU v5p-Kerne pro Projekt und Zone

TPU v5e-Kontingente

TPU v5e kann für Training und Bereitstellung verwendet werden. Es gibt unterschiedliche Kontingente für Training und Bereitstellung sowie Single-Host (Lite-Kerne) und Multi-Hosts (Lite-Pod-Kerne).

Bereitstellungskontingente

Kontingente für die Bereitstellung auf Abruf:

  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Zone

Kontingente für die On-Demand-Bereitstellung:

  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Zone

Trainingskontingente

Kontingente für Training auf Abruf:

  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Trainingskontingente:

  • TPU v5 Lite-Kerne pro Projekt und Region
  • TPU v5 Lite-Kerne pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne pro Projekt und Zone

TPU v4-Kontingente

Sie können Ihr TPU v4-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v4-Pod-Kerne pro Projekt und Region
  • TPU v4-Pod-Kerne pro Projekt und Zone

TPU v3-Kontingente

Es gibt unterschiedliche TPU v3-Kontingente für Einzelhost-TPUs (Kern) und Multihost-TPUs (Pod) aus. Sie müssen v3-Pod-Kontingente verwenden, um TPUs mit mehr als 8 Kernen zu erstellen.

Kontingente auf Abruf:

  • TPU v3-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Kerne auf Abruf pro Projekt und Zone
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v3-Kerne pro Projekt und Region
  • TPU v3-Kerne pro Projekt und Zone
  • TPU v3-Pod-Kerne pro Projekt und Region
  • TPU v3-Pod-Kerne pro Projekt und Zone

TPU v2-Kontingente

Es gibt separate TPU v2-Kontingente für TPUs mit einzelnem Host (Kern) und TPUs mit mehreren Hosts. (Pod) aus.

Kontingente auf Abruf:

  • TPU v2-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Kerne auf Abruf pro Projekt und Zone
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v2-Kerne pro Projekt und Region
  • TPU v2-Kerne pro Projekt und Zone
  • TPU v2-Pod-Kerne pro Projekt und Region
  • TPU v2-Pod-Kerne pro Projekt und Zone

Weitere Informationen zu TPU-Chips und TensorCores finden Sie unter TPU-Systemarchitektur.

Kontingent aufrufen und zusätzliche Kontingente anfordern

Sie können das Ihrem Google Cloud-Projekt zugewiesene Kontingent auf der Seite „Kontingente“ im Google Cloud Console Wenn Sie Wenn Sie ein zusätzliches Cloud TPU-Kontingent benötigen, können Sie es unter „Kontingente“ anfordern Seite. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.