Cloud TPU-Kontingente
In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Informationen zu den Preisen für Cloud TPU finden Sie unter Cloud TPU-Preise.
Ein Kontingent schränkt ein, wie viel von einer bestimmten gemeinsam genutzten Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen kann, einschließlich Hardware, Software und Netzwerkkomponenten. Daher sind Kontingente Teil eines Systems, das Folgendes tut:
- Ihre Nutzung oder Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen.
- Ihren Verbrauch dieser Ressourcen einschränken, um u. a. für Fairness zu sorgen und Nutzungsspitzen zu reduzieren.
- Konfigurationen verwalten, die automatisch vorgeschriebene Einschränkungen erzwingen.
- Möglichkeit, das Kontingent anzufordern oder zu ändern.
Wenn ein Kontingentlimit überschritten wird, blockiert das System in den meisten Fällen den Zugriff auf die entsprechende Google-Ressource und die Aufgabe, die Sie ausführen möchten, schlägt fehl. In den meisten Fällen gelten Kontingente für jedes Google Cloud-Projekt und werden von allen Anwendungen und IP-Adressen geteilt, die dieses Google Cloud-Projekt verwenden.
TPU-Kontingent
Für jede TPU-Version gibt es unterschiedliche Kontingente. Für TPU v2, v3 usw. gelten beispielsweise unterschiedliche Kontingente. Für jede TPU-Version gibt es verschiedene Arten von Kontingenten: On-Demand und auf Abruf (Spot). In der folgenden Tabelle werden die verschiedenen Kontingentarten beschrieben.
Kontingenttyp | Beschreibung | Standardwert | Anfrage senden | Flags für die TPU-Erstellung |
---|---|---|---|---|
On demand | Die Anzahl der On-Demand-Ressourcen, auf die Sie Zugriff haben. On-Demand-Ressourcen werden nicht vorzeitig beendet, aber ein On-Demand-Kontingent garantiert nicht, dass genügend Cloud TPU-Ressourcen verfügbar sind, um Ihre Anfrage zu erfüllen. |
v3-8 und v2-8: 16 TensorCores Alle anderen: 0 |
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. | Keine Flags erforderlich, standardmäßig ausgewählt. |
Auf Abruf | Die Anzahl der Cloud TPU-Ressourcen auf Abruf, auf die Sie Zugriff haben. Dieses Kontingent gilt sowohl für TPUs auf Abruf als auch für TPU-Spot-VMs. Ressourcen auf Abruf können vorzeitig beendet werden, um Platz für Jobs mit höherer Priorität zu schaffen. Ein Kontingent auf Abruf garantiert nicht, dass genügend Cloud TPU-Ressourcen verfügbar sind, um Ihrer Anfrage nachzukommen. Weitere Informationen finden Sie unter TPUs auf Abruf und TPU-Spot-VMs verwalten. |
v3-8 und v2-8: 48 TensorCores Alle anderen: 0 |
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. |
|
TPU-Kontingente werden in Form von TPU-Kernen pro Projekt und Zone oder als TPU-Kerne pro Projekt und Region angegeben.
TPU v5p-Kontingente
Sie können Ihr TPU-v5p-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent für 32 Kerne haben, können Sie mit diesem Kontingent vier TPU-Segmente mit jeweils 8 Kernen erstellen.
Kontingente auf Abruf:
- TPU v5p-Kerne auf Abruf pro Projekt und Region
- TPU v5p-Kerne auf Abruf pro Projekt und Zone
On-Demand-Kontingente:
- TPU v5p-Kerne pro Projekt und Region
- TPU v5p-Kerne pro Projekt und Zone
TPU v5e-Kontingente
TPU v5e kann für Training und Bereitstellung verwendet werden. Es gibt separate Kontingente für Training und Bereitstellung sowie für einzelne Hosts (Lite-Kerne) und Multi-Hosts (Lite-Pod-Kerne).
Bereitstellungskontingente
Kontingente für die Bereitstellung auf Abruf:
- TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Region
- TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Zone
Kontingente für die On-Demand-Bereitstellung:
- TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
- TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Zone
Trainingskontingente
Kontingente für Training auf Abruf:
- TPU v5 Lite-Kerne auf Abruf pro Projekt und Region
- TPU v5 Lite-Kerne auf Abruf pro Projekt und Zone
- TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Region
- TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone
On-Demand-Trainingskontingente:
- TPU v5 Lite-Kerne pro Projekt und Region
- TPU v5 Lite-Kerne pro Projekt und Zone
- TPU v5 Lite-Pod-Kerne pro Projekt und Region
- TPU v5 Lite-Pod-Kerne pro Projekt und Zone
TPU v4-Kontingente
Sie können Ihr TPU v4-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent für 32 Kerne haben, können Sie mit diesem Kontingent vier TPU-Segmente mit jeweils 8 Kernen erstellen.
Kontingente auf Abruf:
- TPU v4-Pod-Kerne auf Abruf pro Projekt und Region
- TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone
On-Demand-Kontingente:
- TPU v4-Pod-Kerne pro Projekt und Region
- TPU v4-Pod-Kerne pro Projekt und Zone
TPU v3-Kontingente
Für TPU v3-Kontingente gelten für Einzelhost-TPUs (Kern) und Multihost-TPUs (Pods). Sie müssen v3-Pod-Kontingente verwenden, um TPUs mit mehr als 8 Kernen zu erstellen.
Kontingente auf Abruf:
- TPU v3-Kerne auf Abruf pro Projekt und Region
- TPU v3-Kerne auf Abruf pro Projekt und Zone
- TPU v3-Pod-Kerne auf Abruf pro Projekt und Region
- TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone
On-Demand-Kontingente:
- TPU v3-Kerne pro Projekt und Region
- TPU v3-Kerne pro Projekt und Zone
- TPU v3-Pod-Kerne pro Projekt und Region
- TPU v3-Pod-Kerne pro Projekt und Zone
TPU v2-Kontingente
Es gibt separate TPU v2-Kontingente für TPUs mit einzelnem Host (Kern) und TPUs mit mehreren Hosts (Pods).
Kontingente auf Abruf:
- TPU v2-Kerne auf Abruf pro Projekt und Region
- TPU v2-Kerne auf Abruf pro Projekt und Zone
- TPU v2-Pod-Kerne auf Abruf pro Projekt und Region
- TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone
On-Demand-Kontingente:
- TPU v2-Kerne pro Projekt und Region
- TPU v2-Kerne pro Projekt und Zone
- TPU v2-Pod-Kerne pro Projekt und Region
- TPU v2-Pod-Kerne pro Projekt und Zone
Weitere Informationen zu TPU-Chips und TensorCores finden Sie unter TPU-Systemarchitektur.
Kontingent aufrufen und weitere Kontingente anfordern
Sie können das Ihrem Google Cloud-Projekt zugewiesene Kontingent in der Google Cloud Console auf der Seite „Kontingente“ ansehen. Wenn Sie ein zusätzliches Cloud TPU-Kontingent benötigen, können Sie es auf der Seite „Kontingente“ anfordern. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.