Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Cloud TPU-Preise

Cloud TPUs sind benutzerdefinierte Supercomputer, die für den Einsatz hochmoderner Modelle für maschinelles Lernen in Google Cloud entwickelt wurden. Sie bieten ein branchenführendes Preis-Leistungs-Verhältnis. Die Exaflops der Rechenleistung können Ihnen dabei helfen, Ihr Unternehmen zu transformieren oder den nächsten Durchbruch in der Forschung zu erzielen.

Weitere Informationen dazu, wie Cloud TPU v4 Pods ML-Forschern und -Entwicklern dabei helfen, die Grenzen von KI auf nachhaltige und effiziente Weise voranzutreiben.

Hier erfahren Sie, welches der Cloud TPU-Produkte für Ihre jeweiligen Projektanforderungen am besten geeignet ist.

So funktionieren Cloud TPU-Preise

Produkte

Cloud TPU v4-Pods sind die neueste Generation der benutzerdefinierten ML-Beschleuniger von Google und jetzt in GA verfügbar. Alle TPU v4 Pod-Slice-Formen verwenden das gleiche v4 Preissystem.

Die TPU-Preise und -Kontingente für Cloud TPU v2 und v3 sind in zwei Systeme unterteilt:

  • TPU-Preise für einzelne Geräte für einzelne TPU-Geräte, die on demand oder auf Abruf verfügbar sind (70% Rabatt auf den Preis der Bewertungsliste). TPU-Typen für Einzelgeräte sind unabhängige TPU-Geräte ohne direkte Netzwerkverbindungen zu anderen TPU-Geräten in einem Google-Rechenzentrum. Wenn Ihre Arbeitslasten mehr TPU-Kerne und einen größeren Arbeitsspeicherpool benötigen, verwenden Sie stattdessen ein TPU-Pod-Segment.
  • TPU Pod-Preise für Cluster von TPU-Geräten, die über dedizierte Hochgeschwindigkeitsnetzwerke miteinander verbunden sind. Diese TPU-Typen sind verfügbar, wenn Sie ein Kennenlernkontingent, ein präemptives Kontingent (70% Rabatt auf den Preis der Bewertungsliste) haben oder eine Zusicherung für 1 Jahr oder 3 Jahre erwerben.

Weitere Informationen zu TPU v2, v3 und v4 finden Sie unter TPU-Systemarchitektur.

Gebühren für Cloud TPU fallen an, während Ihr TPU-Knoten sich in einem READY-Status befindet. Am Ende jedes Abrechnungszeitraums erhalten Sie eine Rechnung mit einer Auflistung der Nutzung und Kosten.

Nutzungsoptionen

Typ TPU-Produkte Abrechnung Eignung:
Vertragsdauer: 3 Jahre (3 Jahre CUD) TPU v4 Pods, TPU v3 Pods, TPU v2 Pods Monatlich, basierend auf reserviertem Kontingent ML-Nutzer, die konsistenten Zugriff auf mehr als 512 Kerne benötigen
Zusicherung für 1 Jahr (1 JJ) TPU v4 Pods, TPU v3 Pods, TPU v2 Pods Monatlich, basierend auf reserviertem Kontingent ML-Nutzer, die ständigen Zugriff auf 32–512 Kerne in der Kapazität benötigen
Bewertung (auf Anfrage) TPU v4 Pods, TPU v3 Pods, TPU v2 Pods, TPU v3*, TPU v2* Stündlich, basierend auf der tatsächlichen Nutzung ML-Nutzer, die kurzfristige Tests oder Benchmarks durchführen möchten
Auf Abruf TPU v4 Pods, TPU v3*, TPU v3 Pods, TPU v2*, TPU v2 Pods Stündlich, basierend auf der tatsächlichen Nutzung ML-Nutzer, die Batch-/fehlertolerante Arbeitslasten ausführen möchten

*Einzelne Geräte mit 8 Kernen. Auf der Seite „SKU“ werden diese Geräte Tpu-v2 oder Tpu-v3 Accelerators genannt.

Chips vs. Cores vs. VMs

1 TPU-VM (TPU Virtual Machine) hat 4 Chips und 8 Kerne. Die Abrechnung in der Google Cloud Console wird in VM-Stunden angegeben (z. B. wird der On-Demand-Preis für einen einzelnen Cloud TPU v4-Host mit vier TPU v4-Chips als 12,88 $pro Stunde angezeigt). Die Nutzungsdaten in der Google Cloud Console werden auch in VM-Stunden gemessen.

Kostenloser Zugriff über TRC

Neukunden erhalten ein Guthaben im Wert von 300 $ für Google Cloud. Jetzt starten

Wenn Sie Forscher, Student, Tünger, Künstler oder Unternehmer sind, sollten Sie sich für das TPU Research Cloud-Programm bewerben. TRC-Mitgliedern wird kostenloser Zugriff auf einen großen Cluster von Cloud TPUs gewährt und ihre Arbeit über öffentlich zugängliche Publikationen, Open-Source-Code, Blogposts, Videos und andere Medien mit der Welt geteilt. (Hier finden Sie Beispiele für TRC-unterstützte Publikationen.)

Bewerben Sie sich jetzt und beschleunigen Sie Ihre Recherche!

Preisgestaltung

Cloud TPU v4 – Preise

Cloud TPU v4 ist die neueste Generation der benutzerdefinierten ML-Beschleuniger von Google und jetzt in GA verfügbar. Sie ist mit Cloud TPU v2 und v3 abwärtskompatibel, hat jedoch eine unverarbeitete Rechenleistung pro Chip mehr als 2x. Jeder TPU-v4-Chip enthält auch einen einzelnen logischen Kern, der die Auslastung eines kompletten 32-GiB-Speichers aus einem Programm ermöglicht. Bei v2 sind es 8 GiB und bei v3 16 GiB. Cloud TPU v4 Pod-Segmente werden mit einer benutzerdefinierten Interconnect-Verbindung verbunden, die eine 3D-Mesh-Topologie verwendet, ein Upgrade vom 2D-Mesh in v2 und v3 und in Konfigurationen von vier Chips (eine TPU-VM) bis hin zu Tausenden von Chips verfügbar ist.

Cloud TPU v4 Pods sind in us-central2-b verfügbar, dem Rechenzentrum von Google, das zu 90% CO2-frei mit Strom aus dem gleichen Netz arbeitet. Dies ist der weltweit größte öffentlich verfügbare ML-Hub mit bis zu 9 Exaflops an aggregierter Spitzenleistung.

In der folgenden Tabelle sind die Preise für Cloud TPU v4-Konfigurationen aufgeführt. Die Preise für v4 basieren auf der Anzahl der Chips in der Topologie. Jeder Chip hat 2 Kerne.

Preise für TPU v4 Preis pro Chipstunde Rabatt (in %) auf Anfrage
On-Demand / Bewertung 3,22 €
1Y-CUD-Reservierung (Rabatt für zugesicherte Nutzung) 2,03 € 37 %
Reservierung für 3J CUD (Rabatt für zugesicherte Nutzung) 1,45 € 55 %
Auf Abruf 0,97 € 70 %

Cloud TPU v2 und v3 – Preise

Preise und Kontingente für TPU v2 und v3 TPU sind in zwei Systeme unterteilt:

  • TPU-Preise für Einzelgeräte für einzelne TPU-Geräte, die on demand oder als Geräte auf Abruf verfügbar sind. Sie können nicht mehrere TPU-Typen mit einzelnen Geräten kombinieren, um an einer einzelnen Arbeitslast zusammenzuarbeiten.
  • TPU Pod-Preise für Cluster von TPU-Geräten, die über dedizierte Hochgeschwindigkeitsnetzwerke miteinander verbunden sind. Diese TPU-Typen sind nur verfügbar, wenn Sie ein Kennenlernkontingent haben oder eine Zusicherung für 1 Jahr oder 3 Jahre erwerben.

In der Dokumentation zur TPU-Systemarchitektur finden Sie Architekturdetails und die Unterschiede zwischen v2, v3 und v4.

Einzelgerätepreise

TPU-Typen für Einzelgeräte werden im Sekundentakt abgerechnet. Sie sind on demand oder auf Abruf verfügbar und werden nach der jeweiligen Preiskategorie abgerechnet.

TPU-Typen für Einzelgeräte sind unabhängige TPU-Geräte mit direkten Netzwerkverbindungen zu anderen TPU-Geräten in einem Google-Rechenzentrum. Wenn Ihre Arbeitslasten mehr TPU-Kerne und einen größeren Speicherpool benötigen, nutzen Sie stattdessen einen TPU Pod-Typ.

Eine TPU auf Abruf ist eine TPU, die jederzeit vorzeitig beendet werden kann, wenn Cloud TPU für eine andere Aufgabe Zugriff auf die Ressourcen benötigt. Die Gebühren für eine präemptive TPU sind viel niedriger als für eine normale TPU. Für TPUs auf Abruf, die in der ersten Minute nach dem Erstellen vorzeitig beendet werden, fallen keine Gebühren an.

Preise für TPU Pod-Typen

TPU-Pod-Typen bieten Zugriff auf mehrere TPU-Geräte, die über ein dediziertes Hochgeschwindigkeitsnetzwerk verbunden sind. Diese TPU-Typen bieten eine größere Rechenkapazität und einen größeren TPU-Speicherpool als ein einzelner TPU-Knoten. Wenn Sie TPU Pod-Typen einsetzen wollen, fordern Sie so ein Kontingent an:

  • Fordern Sie Zugriff auf ein Kennenlernkontingent an, damit Sie die Leistung von TPU Pod-Typen testen können. TPU-Knoten, die Sie mit einem Kennenlernkontingent erstellen, werden im Sekundentakt abgerechnet, garantieren aber nicht dasselbe Dienstniveau wie On-Demand-TPU-Geräte oder Geräte, die Sie mit einem Zusicherungskontingent erstellen. Das Kennenlernkontingent gilt nur für einen begrenzten Zeitraum in Ihrem Projekt.
  • Kaufen Sie eine Zusicherung für 1 Jahr oder 3 Jahre und erstellen Sie damit TPU-Knoten mit bis zu 2.048 Kernen. Zusicherungen ermöglichen während der Vertragslaufzeit jederzeit Zugriff auf reservierte Kerne. Ihnen wird für die Dauer der Laufzeit eine feste monatliche Gebühr in Rechnung gestellt, auch wenn Sie keine TPU-Ressourcen verwenden.

Sie können Ihre TPU-Knoten mit den folgenden TPU-Typen konfigurieren:

Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Weitere Informationen zu den Unterschieden zwischen verschiedenen TPU-Versionen und -Konfigurationen finden Sie in der Dokumentation zur TPU-Systemarchitektur.

Kosten optimieren

Cloud TPU v4 bietet bis zu 35% Einsparungen bei Transformer-basierten Modellen und bis zu 50% bei ResNet im Vergleich zu A100 in Azure.

Cloud TPU v4-Kostenvergleich

Die Einsparungen sind besonders aussagekräftig, da reale Modelle wie GPT-3 und PaLM viel größer sind als die BERT- und ResNet-Modelle, die in der MLPerf-Benchmark verwendet werden: PaLM ist ein 540-Milliarden-Parameter-Modell, während das in der MLPerf-Benchmark verwendete BERT-Modell nur 340 Millionen Parameter hat – eine Skalierung von 1.000. Basierend auf unseren Erfahrungen werden die Vorteile von TPUs mit der Größe erheblich wachsen und das Training für Cloud TPU v4 wird noch attraktiver.

Kosten abschätzen

Schätzen Sie die Kosten für die Verwendung von Cloud TPU mit dem Compute Engine-Preisrechner und wählen Sie in der oberen Leiste "Cloud TPU" aus.

Gleich loslegen

Individuelles Angebot einholen

Mit den „Pay as you go“-Preisen von Google Cloud bezahlen Sie nur für die Dienste, die Sie nutzen. Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.
Vertrieb kontaktieren