Cloud TPU-Kontingente
In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Informationen zu den Preisen für Cloud TPU finden Sie unter Cloud TPU-Preise.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und ‑Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Projektebene von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud -Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie in der Cloud-Kontingente-Übersicht.TPU-Kontingent
TPU-Kontingente sind Beschränkungen für die Anzahl der Cloud TPU-Kerne, die Sie mit einemGoogle Cloud -Projekt verwenden können. Jede TPU-Version hat ein eigenes Kontingent. Außerdem wird das Kontingent für jede Cloud TPU-Version in On-Demand-Kontingent und auf Abruf verfügbares (oder Spot-)Kontingent unterteilt.
Wenn Sie Cloud TPU-Ressourcen erstellen, erstellen Sie standardmäßig On-Demand-Ressourcen. Sie können unterbrechbare Ressourcen erstellen, indem Sie beim Erstellen von Ressourcen mit dem Befehl gcloud
den Parameter --spot
verwenden. Weitere Informationen finden Sie unter TPU-Ressourcen verwalten.
Standardkontingente für Cloud TPU
In den folgenden Tabellen sind die Standardwerte für On-Demand- und unterbrechbares Kontingent für jede verfügbare Zone aufgeführt. Diese Werte geben die maximale Anzahl von TPU-Kernen an, die Sie in Ihrem Projekt verwenden können.
Kontingente auf Abruf
TPU-Version | Standardkontingent (Anzahl der Kerne) | Kontingentname |
---|---|---|
v6e | 1.536 Kerne | TPU v6e-Kerne auf Abruf pro Projekt und Zone |
v5p | 768 Kerne | TPU v5p-Kerne auf Abruf pro Projekt und Zone |
v5e | 1.536 Kerne | TPU v5-LitePod-Kerne auf Abruf pro Projekt und Zone |
v4 | 0 Kerne | TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone |
v3-Pod | 32 Kerne | TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone |
v3 | 120 Kerne | TPU v3-Kerne auf Abruf pro Projekt und Zone |
v2-Pod | 32 Kerne | TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone |
v2 | 120 Kerne | TPU v2-Kerne auf Abruf pro Projekt und Zone |
On-Demand-Kontingente
TPU-Version | Standardkontingent (Anzahl der Kerne) | Kontingentname |
---|---|---|
v6e | 512 Kerne | TPU v6e-Kerne pro Projekt und Zone |
v5p | 128 Kerne | TPU v5p-Kerne pro Projekt und Zone |
v5e | 512 Kerne | TPU v5-LitePod-Kerne pro Projekt und Zone |
v4 | 0 Kerne | TPU v4-Pod-Kerne pro Projekt und Zone |
v3-Pod | 32 Kerne | TPU v3-Pod-Kerne pro Projekt und Zone |
v3 | 40 Kerne | TPU v3-Kerne pro Projekt und Zone |
v2-Pod | 32 Kerne | TPU v2-Pod-Kerne pro Projekt und Zone |
v2 | 40 Kerne | TPU v2-Kerne pro Projekt und Zone |
Kontingente ansehen und zusätzliche Kontingente anfordern
Das für Ihr Google Cloud Projekt zugewiesene Kontingent finden Sie in der Google Cloud Console auf der Seite „Kontingente“.
Auf der Seite „Kontingente“ können Sie zusätzliches Cloud TPU-Kontingent anfordern. Suchen Sie das Kontingent, das Sie erhöhen möchten, klicken Sie auf das Dreipunkt-Menü und wählen Sie Kontingent bearbeiten aus. Weitere Informationen finden Sie unter Kontingentanpassung anfordern. Wenn Sie ein Kontingent unter dem Grenzwert für die automatische Genehmigung anfordern, wird Ihre Anfrage automatisch genehmigt.
Kontingente auf Abruf
TPU-Version | Schwellenwert für automatische Genehmigung | Kontingentname |
---|---|---|
v6e | Alle Zonen: 0 Cores | TPU v6e-Kerne auf Abruf pro Projekt und Zone |
v5p | Alle Zonen: 0 Cores | TPU v5p-Kerne auf Abruf pro Projekt und Zone |
v5e |
|
TPU v5-LitePod-Kerne auf Abruf pro Projekt und Zone |
v4 | Alle Zonen: 0 Cores | TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone |
v3-Pod |
|
TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone |
v3 |
|
TPU v3-Kerne auf Abruf pro Projekt und Zone |
v2-Pod |
|
TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone |
v2 |
|
TPU v2-Kerne auf Abruf pro Projekt und Zone |
On-Demand-Kontingente
TPU-Version | Schwellenwert für automatische Genehmigung | Kontingentname |
---|---|---|
v6e | Alle Zonen: 0 Cores | TPU v6e-Kerne pro Projekt und Zone |
v5p | us-east5-a: 64 Kerne | TPU v5p-Kerne pro Projekt und Zone |
v5e | Alle Zonen: 64 Cores | TPU v5-LitePod-Kerne pro Projekt und Zone |
v4 | Alle Zonen: 0 Cores | TPU v4-Pod-Kerne pro Projekt und Zone |
v3-Pod |
|
TPU v3-Pod-Kerne pro Projekt und Zone |
v3 |
|
TPU v3-Kerne pro Projekt und Zone |
v2-Pod |
|
TPU v2-Pod-Kerne pro Projekt und Zone |
v2 |
|
TPU v2-Kerne pro Projekt und Zone |
Sie erhalten eine E‑Mail, in der Sie darüber informiert werden, ob Ihre Kontingentanfrage genehmigt oder abgelehnt wurde. Google Cloud -Dienstkontingenterhöhungen erfolgen schrittweise. Dies kann zu laufenden Roll-outs in verschiedenen Regionen oder Ressourcen führen. Während des Roll-outs spiegelt der Kontingentwert, der in der Google Cloud Console oder der Cloud Quotas API angezeigt wird, nicht den neuen, erhöhten Kontingentwert wider, bis der Roll-out abgeschlossen ist. Weitere Informationen finden Sie unter Laufende Roll-outs ansehen.