Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Informationen zu den Preisen für Cloud TPU finden Sie unter Cloud TPU-Preise.

Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.

Das Cloud-Kontingentsystem ermöglicht Folgendes:

  • Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
  • Ihren Verbrauch dieser Ressourcen einschränken
  • Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.

Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

TPU-Kontingent

Für jede TPU-Version gibt es unterschiedliche Kontingente. So gibt es beispielsweise unterschiedliche Kontingente für TPU v2, v3 usw. Für jede TPU-Version gibt es verschiedene Kontingentarten: On-Demand und auf Abruf (Spot-VMs). In der folgenden Tabelle werden die verschiedenen Kontingentarten beschrieben.

Kontingenttyp Beschreibung Standardwert So stellen Sie einen Antrag Flags für die TPU-Erstellung
On demand Die Anzahl der On-Demand-Ressourcen, auf die Sie Zugriff haben. On demand Ressourcen werden nicht vorzeitig beendet, aber das On-Demand-Kontingent garantiert dies nicht. genügend Cloud TPU-Ressourcen zur Verfügung, um Ihre Anfrage zu erfüllen. v3-8 und v2-8: 16 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. Keine Flags erforderlich, standardmäßig ausgewählt.
Auf Abruf Die Anzahl der auf Abruf verfügbaren Cloud TPU-Ressourcen, auf die Sie Zugriff haben. Dieses Kontingent gilt sowohl für TPUs auf Abruf als auch für TPU-Spot-VMs. Vorwegnehmbare Ressourcen können vorweggenommen werden, um Platz für Jobs mit höherer Priorität zu schaffen. Das präemptive Kontingent garantiert nicht, dass genügend verfügbar ist Cloud TPU-Ressourcen, um Ihre Anfrage zu erfüllen. Weitere Informationen finden Sie unter Präemptive TPUs und TPU Spot-VMs verwalten v3-8 und v2-8: 48 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern.

TPU-Kontingente werden in TPU-Kernen pro Projekt und Zone oder TPU-Kernen pro Projekt und Region angegeben.

Kontingente für TPU v5p

Sie können Ihr TPU v5p-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • Auf Abruf verfügbare TPU v5p-Kerne pro Projekt und Region
  • TPU v5p-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v5p-Kerne pro Projekt und Region
  • TPU v5p-Kerne pro Projekt und Zone

Kontingente für TPU v5e

TPU v5e kann für Training und Bereitstellung verwendet werden. Es gibt unterschiedliche Kontingente für Training und Bereitstellung sowie Single-Host (Lite-Kerne) und Multi-Hosts (Lite-Pod-Kerne).

Bereitstellungskontingente

Kontingente für die Bereitstellung auf Abruf:

  • Anzahl der auf Abruf verfügbaren TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
  • Pod-Kerne der auf Abruf verfügbaren TPU v5 Lite für die Bereitstellung pro Projekt und Zone

Kontingente für die On-Demand-Bereitstellung:

  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Zone

Trainingskontingente

Präemptive Trainingskontingente:

  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Trainingskontingente:

  • TPU v5 Lite-Kerne pro Projekt und Region
  • TPU v5 Lite-Kerne pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne pro Projekt und Zone

TPU v4-Kontingente

Sie können Ihr TPU v4-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v4-Pod-Kerne pro Projekt und Region
  • TPU v4-Pod-Kerne pro Projekt und Zone

TPU v3-Kontingente

Es gibt separate TPU v3-Kontingente für TPUs mit einem einzelnen Host (Kern) und TPUs mit mehreren Hosts (Pod). Sie müssen v3-Pod-Kontingente verwenden, um TPUs mit mehr als 8 Kernen zu erstellen.

Kontingente auf Abruf:

  • TPU v3-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Kerne auf Abruf pro Projekt und Zone
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v3-Kerne pro Projekt und Region
  • TPU v3-Kerne pro Projekt und Zone
  • TPU v3-Pod-Kerne pro Projekt und Region
  • TPU v3-Pod-Kerne pro Projekt und Zone

TPU v2-Kontingente

Es gibt separate TPU v2-Kontingente für TPUs mit einzelnem Host (Kern) und TPUs mit mehreren Hosts. (Pod) aus.

Kontingente auf Abruf:

  • TPU v2-Kerne auf Abruf pro Projekt und Region
  • TPU v2 auf Abruf pro Projekt und Zone
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v2-Kerne pro Projekt und Region
  • TPU v2-Kerne pro Projekt und Zone
  • TPU v2-Pod-Kerne pro Projekt und Region
  • TPU v2-Pod-Kerne pro Projekt und Zone

Weitere Informationen zu TPU-Chips und TensorCores finden Sie unter TPU-System Architektur.

Zusätzliches Kontingent ansehen und anfordern

Sie können das Ihrem Google Cloud-Projekt zugewiesene Kontingent auf der Seite „Kontingente“ im Google Cloud Console Wenn Sie Wenn Sie ein zusätzliches Cloud TPU-Kontingent benötigen, können Sie es unter „Kontingente“ anfordern Seite. Weitere Informationen finden Sie unter Höheres Kontingent anfordern Limit fest.