Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Informationen zu den Preisen für Cloud TPU finden Sie unter Cloud TPU-Preise.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .

Das Cloud-Kontingentsystem tut Folgendes:

Es überwacht Ihren Verbrauch von Produkten und Diensten von Google Cloud .
Es schränkt Ihren Verbrauch dieser Ressourcen ein.
Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.

TPU-Kontingente

TPU-Kontingente begrenzen die Anzahl der Cloud TPU-Kerne, die Sie für ein Projekt inGoogle Cloud verwenden können. Jede TPU-Version hat ihr eigenes Kontingent. Außerdem wird das Kontingent für jede Cloud TPU-Version in On-Demand-Kontingent und auf Abruf verfügbares Kontingent (oder Spot-Kontingent) unterteilt.

Wenn Sie Cloud TPU-Ressourcen erstellen, erstellen Sie standardmäßig On-Demand-Ressourcen. Mit dem Parameter --spot können Sie beim Erstellen von Ressourcen mit dem Befehl gcloud auch Ressourcen auf Abruf erstellen. Weitere Informationen finden Sie unter TPU-Ressourcen verwalten.

Standardkontingente für Cloud TPU

Die folgenden Tabellen enthalten für jede verfügbare Zone die Standardwerte für On-Demand-Kontingente und Kontingente auf Abruf. Diese Werte geben die maximale Anzahl der in Ihrem Projekt verwendbaren TPU-Kerne an.

Kontingente auf Abruf

TPU-Version	Standardkontingent (Anzahl der Kerne)	Kontingentname
v6e	1536 Kerne	TPU v6e-Kerne auf Abruf pro Projekt und Zone
v5p	768 Kerne	TPU v5p-Kerne auf Abruf pro Projekt und Zone
v5e	1536 Kerne	TPU v5-LitePod-Kerne auf Abruf pro Projekt und Zone
v4	0 Kerne	TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone
v3-Pod	32 Kerne	TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone
v3	120 Kerne	TPU v3-Kerne auf Abruf pro Projekt und Zone
v2-Pod	32 Kerne	TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone
v2	120 Kerne	TPU v2-Kerne auf Abruf pro Projekt und Region

On-Demand-Kontingente

TPU-Version	Standardkontingent (Anzahl der Kerne)	Kontingentname
v6e	512 Kerne	TPU v6e-Kerne pro Projekt und Zone
v5p	128 Kerne	TPU v5p-Kerne pro Projekt und Zone
v5e	512 Kerne	TPU v5-LitePod-Kerne pro Projekt und Zone
v4	0 Kerne	TPU v4-Pod-Kerne pro Projekt und Zone
v3-Pod	32 Kerne	TPU v3-Pod-Kerne pro Projekt und Zone
v3	40 Kerne	TPU v3-Kerne pro Projekt und Zone
v2-Pod	32 Kerne	TPU v2-Pod-Kerne pro Projekt und Zone
v2	40 Kerne	TPU v2-Kerne pro Projekt und Zone

Kontingente ansehen und weitere Kontingente anfordern

Das Ihrem Projekt in Google Cloud zugewiesene Kontingent finden Sie in der Google Cloud Console auf der Seite „Kontingente“.

Auf der Seite „Kontingente“ können Sie weitere Cloud TPU-Kontingente anfordern. Suchen Sie das Kontingent, das Sie erhöhen möchten, klicken Sie auf das Dreipunkt-Menü und wählen Sie Kontingent bearbeiten aus. Weitere Informationen finden Sie unter Kontingentanpassung anfordern. Wenn Sie ein Kontingent unterhalb des Schwellenwerts für die automatische Genehmigung beantragen, wird Ihre Anforderung automatisch genehmigt.

Kontingente auf Abruf

TPU-Version	Schwellenwert für automatische Genehmigung	Kontingentname
v6e	Alle Zonen: 0 Kerne	TPU v6e-Kerne auf Abruf pro Projekt und Zone
v5p	Alle Zonen: 0 Kerne	TPU v5p-Kerne auf Abruf pro Projekt und Zone
v5e	us-east5-b: 800 Kerne us-west4-a: 1.600 Kerne us-west4-b: 3.968 Kerne us-west1-c: 576 Kerne us-central1-a: 3.264 Kerne europe-west4-a: 4.032 Kerne	TPU v5-LitePod-Kerne auf Abruf pro Projekt und Zone
v4	Alle Zonen: 0 Kerne	TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone
v3-Pod	europe-west4-a: 512 Kerne us-east1-d: 320 Kerne	TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone
v3	us-central1-a: 64 Kerne europe-west4-a: 128 Kerne	TPU v3-Kerne auf Abruf pro Projekt und Zone
v2-Pod	us-central1-a: 64 Kerne europe-west4-a: 64 Kerne	TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone
v2	us-central1-b: 128 Kerne us-central1-c: 64 Kerne us-central1-f: 128 Kerne europe-west4-a: 32 Kerne	TPU v2-Kerne auf Abruf pro Projekt und Region

On-Demand-Kontingente

TPU-Version	Schwellenwert für automatische Genehmigung	Kontingentname
v6e	Alle Zonen: 0 Kerne	TPU v6e-Kerne pro Projekt und Zone
v5p	us-east5-a: 64 Kerne	TPU v5p-Kerne pro Projekt und Zone
v5e	Alle Zonen: 64 Kerne	TPU v5-LitePod-Kerne pro Projekt und Zone
v4	Alle Zonen: 0 Kerne	TPU v4-Pod-Kerne pro Projekt und Zone
v3-Pod	europe-west4-a: 128 Kerne us-east1-d: 64 Kerne	TPU v3-Pod-Kerne pro Projekt und Zone
v3	us-central1-a: 64 Kerne europe-west4-a: 128 Kerne	TPU v3-Kerne pro Projekt und Zone
v2-Pod	us-central1-a: 64 Kerne europe-west4-a: 64 Kerne	TPU v2-Pod-Kerne pro Projekt und Zone
v2	us-central1-b: 128 Kerne us-central1-c: 64 Kerne us-central1-f: 128 Kerne europe-west4-a: 32 Kerne	TPU v2-Kerne pro Projekt und Zone

Sie erhalten eine E‑Mail, in der Sie darüber informiert werden, ob Ihre Kontingentanforderung genehmigt oder abgelehnt wurde. Die Dienstkontingente vonGoogle Cloud werden schrittweise erhöht. Dies kann zu laufenden Roll-outs in verschiedenen Regionen oder Ressourcen führen. Während des Roll-outs spiegelt der in der Google Cloud Console oder der Cloud Quotas API angezeigte Kontingentwert den neuen, erhöhten Kontingentwert erst nach Abschluss des Roll-outs wider. Weitere Informationen finden Sie unter Laufende Roll-outs ansehen.