Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Weitere Informationen Informationen zu Cloud TPU-Preisen finden Sie unter Cloud TPU-Preise.

Ein Kontingent schränkt ein, wie viel von einer bestimmten gemeinsam genutzten Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen kann, einschließlich Hardware, Software und Netzwerkkomponenten. Daher sind Kontingente Teil eines Systems, das Folgendes tut:

  • Ihre Nutzung oder Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen.
  • Ihren Verbrauch dieser Ressourcen einschränken, um u. a. für Fairness zu sorgen und Nutzungsspitzen zu reduzieren.
  • Konfigurationen verwalten, die automatisch vorgeschriebene Einschränkungen erzwingen.
  • Möglichkeit, das Kontingent anzufordern oder zu ändern.

Wenn ein Kontingentlimit überschritten wird, blockiert das System in den meisten Fällen den Zugriff auf die entsprechende Google-Ressource und die Aufgabe, die Sie ausführen möchten, schlägt fehl. In den meisten Fällen gelten Kontingente für jedes Google Cloud-Projekt und werden von allen Anwendungen und IP-Adressen geteilt, die dieses Google Cloud-Projekt verwenden.

TPU-Kontingent

Für jede TPU-Version gibt es unterschiedliche Kontingente. Zum Beispiel gibt es verschiedene Kontingente für TPU v2, v3 usw. Für jede TPU-Version gibt es verschiedene Kontingentarten: On-Demand und auf Abruf (Spot). In der folgenden Tabelle werden die verschiedenen Kontingentarten beschrieben.

Kontingenttyp Beschreibung Standardwert Anfrage senden Flags für die TPU-Erstellung
On demand Die Anzahl der On-Demand-Ressourcen, auf die Sie Zugriff haben. On demand Ressourcen werden nicht vorzeitig beendet, aber das On-Demand-Kontingent garantiert dies nicht. genügend Cloud TPU-Ressourcen zur Verfügung, um Ihre Anfrage zu erfüllen. v3-8 und v2-8: 16 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. Keine Flags erforderlich, standardmäßig ausgewählt.
Auf Abruf Die Anzahl der Cloud TPU-Ressourcen auf Abruf, auf die Sie Zugriff haben. Dieses Kontingent gilt sowohl für TPUs auf Abruf als auch für TPU-Spot-VMs. Ressourcen auf Abruf können vorzeitig beendet werden, um Platz für höhere Priorität zu schaffen Jobs. Das präemptive Kontingent garantiert nicht, dass genügend verfügbar ist Cloud TPU-Ressourcen, um Ihre Anfrage zu erfüllen. Weitere Informationen finden Sie unter Präemptive TPUs und TPU Spot-VMs verwalten. v3-8 und v2-8: 48 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern.

TPU-Kontingente werden in Form von TPU-Kernen pro Projekt und Zone oder als TPU-Kerne angegeben pro Projekt und Region.

TPU v5p-Kontingente

Sie können Ihr TPU-v5p-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v5p-Kerne auf Abruf pro Projekt und Region
  • TPU v5p-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v5p-Kerne pro Projekt und Region
  • TPU v5p-Kerne pro Projekt und Zone

TPU v5e-Kontingente

TPU v5e kann für Training und Bereitstellung verwendet werden. Es gibt unterschiedliche Kontingente für Training und Bereitstellung sowie Single-Host (Lite-Kerne) und Multi-Hosts (Lite-Pod-Kerne).

Bereitstellungskontingente

Kontingente für die Bereitstellung auf Abruf:

  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Zone

Kontingente für die On-Demand-Bereitstellung:

  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Zone

Trainingskontingente

Kontingente für Training auf Abruf:

  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Trainingskontingente:

  • TPU v5 Lite-Kerne pro Projekt und Region
  • TPU v5 Lite-Kerne pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne pro Projekt und Zone

TPU v4-Kontingente

Sie können Ihr TPU v4-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v4-Pod-Kerne pro Projekt und Region
  • TPU v4-Pod-Kerne pro Projekt und Zone

TPU v3-Kontingente

Es gibt unterschiedliche TPU v3-Kontingente für Einzelhost-TPUs (Kern) und Multihost-TPUs (Pod) aus. Sie müssen v3-Pod-Kontingente verwenden, um TPUs mit mehr als 8 Kernen zu erstellen.

Kontingente auf Abruf:

  • TPU v3-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Kerne auf Abruf pro Projekt und Zone
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v3-Kerne pro Projekt und Region
  • TPU v3-Kerne pro Projekt und Zone
  • TPU v3-Pod-Kerne pro Projekt und Region
  • TPU v3-Pod-Kerne pro Projekt und Zone

TPU v2-Kontingente

Es gibt separate TPU v2-Kontingente für TPUs mit einzelnem Host (Kern) und TPUs mit mehreren Hosts. (Pod) aus.

Kontingente auf Abruf:

  • TPU v2-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Kerne auf Abruf pro Projekt und Zone
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v2-Kerne pro Projekt und Region
  • TPU v2-Kerne pro Projekt und Zone
  • TPU v2-Pod-Kerne pro Projekt und Region
  • TPU v2-Pod-Kerne pro Projekt und Zone

Weitere Informationen zu TPU-Chips und TensorCores finden Sie unter TPU-System Architektur.

Kontingent aufrufen und weitere Kontingente anfordern

Sie können das Ihrem Google Cloud-Projekt zugewiesene Kontingent auf der Seite „Kontingente“ im Google Cloud Console Wenn Sie Wenn Sie ein zusätzliches Cloud TPU-Kontingent benötigen, können Sie es unter „Kontingente“ anfordern Seite. Weitere Informationen finden Sie unter Höheres Kontingent anfordern Limit fest.