Cloud TPU-Preise
Cloud TPUs sind benutzerdefinierte Supercomputer, die für den Einsatz hochmoderner Modelle für maschinelles Lernen in Google Cloud entwickelt wurden. Sie bieten ein branchenführendes Preis-Leistungs-Verhältnis. Die Exaflops der Rechenleistung können Ihnen dabei helfen, Ihr Unternehmen zu transformieren oder den nächsten Durchbruch in der Forschung zu erzielen.
Weitere Informationen dazu, wie Cloud TPU v4 Pods ML-Forschern und -Entwicklern dabei helfen, die Grenzen von KI auf nachhaltige und effiziente Weise voranzutreiben.
Hier erfahren Sie, welches der Cloud TPU-Produkte für Ihre jeweiligen Projektanforderungen am besten geeignet ist.
So funktionieren Cloud TPU-Preise
Produkte
Cloud TPU v4-Pods sind die neueste Generation der benutzerdefinierten ML-Beschleuniger von Google und jetzt in GA verfügbar. Alle TPU v4 Pod-Slice-Formen verwenden das gleiche v4 Preissystem.
Die TPU-Preise und -Kontingente für Cloud TPU v2
und v3
sind in zwei Systeme unterteilt:
- TPU-Preise für einzelne Geräte für einzelne TPU-Geräte, die on demand oder auf Abruf verfügbar sind (70% Rabatt auf den Preis der Bewertungsliste). TPU-Typen für Einzelgeräte sind unabhängige TPU-Geräte ohne direkte Netzwerkverbindungen zu anderen TPU-Geräten in einem Google-Rechenzentrum. Wenn Ihre Arbeitslasten mehr TPU-Kerne und einen größeren Arbeitsspeicherpool benötigen, verwenden Sie stattdessen ein TPU-Pod-Segment.
- TPU Pod-Preise für Cluster von TPU-Geräten, die über dedizierte Hochgeschwindigkeitsnetzwerke miteinander verbunden sind. Diese TPU-Typen sind verfügbar, wenn Sie ein Kennenlernkontingent, ein präemptives Kontingent (70% Rabatt auf den Preis der Bewertungsliste) haben oder eine Zusicherung für 1 Jahr oder 3 Jahre erwerben.
Weitere Informationen zu TPU v2, v3 und v4 finden Sie unter TPU-Systemarchitektur.
Gebühren für Cloud TPU fallen an, während Ihr TPU-Knoten sich in einem READY
-Status befindet.
Am Ende jedes Abrechnungszeitraums erhalten Sie eine Rechnung mit einer Auflistung der Nutzung und Kosten.
Nutzungsoptionen
Typ | TPU-Produkte | Abrechnung | Eignung: |
---|---|---|---|
Vertragsdauer: 3 Jahre (3 Jahre CUD) | TPU v4 Pods, TPU v3 Pods, TPU v2 Pods | Monatlich, basierend auf reserviertem Kontingent | ML-Nutzer, die konsistenten Zugriff auf mehr als 512 Kerne benötigen |
Zusicherung für 1 Jahr (1 JJ) | TPU v4 Pods, TPU v3 Pods, TPU v2 Pods | Monatlich, basierend auf reserviertem Kontingent | ML-Nutzer, die ständigen Zugriff auf 32–512 Kerne in der Kapazität benötigen |
Bewertung (auf Anfrage) | TPU v4 Pods, TPU v3 Pods, TPU v2 Pods, TPU v3*, TPU v2* | Stündlich, basierend auf der tatsächlichen Nutzung | ML-Nutzer, die kurzfristige Tests oder Benchmarks durchführen möchten |
Auf Abruf | TPU v4 Pods, TPU v3*, TPU v3 Pods, TPU v2*, TPU v2 Pods | Stündlich, basierend auf der tatsächlichen Nutzung | ML-Nutzer, die Batch-/fehlertolerante Arbeitslasten ausführen möchten |
*Einzelne Geräte mit 8 Kernen. Auf der Seite „SKU“ werden diese Geräte Tpu-v2 oder Tpu-v3 Accelerators genannt.
Chips vs. Cores vs. VMs
1 TPU-VM (TPU Virtual Machine) hat 4 Chips und 8 Kerne. Die Abrechnung in der Google Cloud Console wird in VM-Stunden angegeben (z. B. wird der On-Demand-Preis für einen einzelnen Cloud TPU v4-Host mit vier TPU v4-Chips als 12,88 $pro Stunde angezeigt). Die Nutzungsdaten in der Google Cloud Console werden auch in VM-Stunden gemessen.
Kostenloser Zugriff über TRC
Neukunden erhalten ein Guthaben im Wert von 300 $ für Google Cloud. Jetzt starten
Wenn Sie Forscher, Student, Tünger, Künstler oder Unternehmer sind, sollten Sie sich für das TPU Research Cloud-Programm bewerben. TRC-Mitgliedern wird kostenloser Zugriff auf einen großen Cluster von Cloud TPUs gewährt und ihre Arbeit über öffentlich zugängliche Publikationen, Open-Source-Code, Blogposts, Videos und andere Medien mit der Welt geteilt. (Hier finden Sie Beispiele für TRC-unterstützte Publikationen.)
Bewerben Sie sich jetzt und beschleunigen Sie Ihre Recherche!
Preisgestaltung
Cloud TPU v4 – Preise
Cloud TPU v4 ist die neueste Generation der benutzerdefinierten ML-Beschleuniger von Google und jetzt in GA verfügbar. Sie ist mit Cloud TPU v2 und v3 abwärtskompatibel, hat jedoch eine unverarbeitete Rechenleistung pro Chip mehr als 2x. Jeder TPU-v4-Chip enthält auch einen einzelnen logischen Kern, der die Auslastung eines kompletten 32-GiB-Speichers aus einem Programm ermöglicht. Bei v2 sind es 8 GiB und bei v3 16 GiB. Cloud TPU v4 Pod-Segmente werden mit einer benutzerdefinierten Interconnect-Verbindung verbunden, die eine 3D-Mesh-Topologie verwendet, ein Upgrade vom 2D-Mesh in v2 und v3 und in Konfigurationen von vier Chips (eine TPU-VM) bis hin zu Tausenden von Chips verfügbar ist.
Cloud TPU v4 Pods sind in us-central2-b verfügbar, dem Rechenzentrum von Google, das zu 90% CO2-frei mit Strom aus dem gleichen Netz arbeitet. Dies ist der weltweit größte öffentlich verfügbare ML-Hub mit bis zu 9 Exaflops an aggregierter Spitzenleistung.
In der folgenden Tabelle sind die Preise für Cloud TPU v4-Konfigurationen aufgeführt. Die Preise für v4
basieren auf der Anzahl der Chips in der Topologie. Jeder Chip hat 2 Kerne.
Preise für TPU v4 | Preis pro Chipstunde | Rabatt (in %) auf Anfrage |
---|---|---|
On-Demand / Bewertung | 3,22 € | |
1Y-CUD-Reservierung (Rabatt für zugesicherte Nutzung) | 2,03 € | 37 % |
Reservierung für 3J CUD (Rabatt für zugesicherte Nutzung) | 1,45 € | 55 % |
Auf Abruf | 0,97 € | 70 % |
Cloud TPU v2 und v3 – Preise
Preise und Kontingente für TPU v2 und v3 TPU sind in zwei Systeme unterteilt:
- TPU-Preise für Einzelgeräte für einzelne TPU-Geräte, die on demand oder als Geräte auf Abruf verfügbar sind. Sie können nicht mehrere TPU-Typen mit einzelnen Geräten kombinieren, um an einer einzelnen Arbeitslast zusammenzuarbeiten.
- TPU Pod-Preise für Cluster von TPU-Geräten, die über dedizierte Hochgeschwindigkeitsnetzwerke miteinander verbunden sind. Diese TPU-Typen sind nur verfügbar, wenn Sie ein Kennenlernkontingent haben oder eine Zusicherung für 1 Jahr oder 3 Jahre erwerben.
In der Dokumentation zur TPU-Systemarchitektur finden Sie Architekturdetails und die Unterschiede zwischen v2, v3 und v4.
Einzelgerätepreise
TPU-Typen für Einzelgeräte werden im Sekundentakt abgerechnet. Sie sind on demand oder auf Abruf verfügbar und werden nach der jeweiligen Preiskategorie abgerechnet.
TPU-Typen für Einzelgeräte sind unabhängige TPU-Geräte mit direkten Netzwerkverbindungen zu anderen TPU-Geräten in einem Google-Rechenzentrum. Wenn Ihre Arbeitslasten mehr TPU-Kerne und einen größeren Speicherpool benötigen, nutzen Sie stattdessen einen TPU Pod-Typ.
Eine TPU auf Abruf ist eine TPU, die jederzeit vorzeitig beendet werden kann, wenn Cloud TPU für eine andere Aufgabe Zugriff auf die Ressourcen benötigt. Die Gebühren für eine präemptive TPU sind viel niedriger als für eine normale TPU. Für TPUs auf Abruf, die in der ersten Minute nach dem Erstellen vorzeitig beendet werden, fallen keine Gebühren an.
Preise für TPU Pod-Typen
TPU-Pod-Typen bieten Zugriff auf mehrere TPU-Geräte, die über ein dediziertes Hochgeschwindigkeitsnetzwerk verbunden sind. Diese TPU-Typen bieten eine größere Rechenkapazität und einen größeren TPU-Speicherpool als ein einzelner TPU-Knoten. Wenn Sie TPU Pod-Typen einsetzen wollen, fordern Sie so ein Kontingent an:
- Fordern Sie Zugriff auf ein Kennenlernkontingent an, damit Sie die Leistung von TPU Pod-Typen testen können. TPU-Knoten, die Sie mit einem Kennenlernkontingent erstellen, werden im Sekundentakt abgerechnet, garantieren aber nicht dasselbe Dienstniveau wie On-Demand-TPU-Geräte oder Geräte, die Sie mit einem Zusicherungskontingent erstellen. Das Kennenlernkontingent gilt nur für einen begrenzten Zeitraum in Ihrem Projekt.
- Kaufen Sie eine Zusicherung für 1 Jahr oder 3 Jahre und erstellen Sie damit TPU-Knoten mit bis zu 2.048 Kernen. Zusicherungen ermöglichen während der Vertragslaufzeit jederzeit Zugriff auf reservierte Kerne. Ihnen wird für die Dauer der Laufzeit eine feste monatliche Gebühr in Rechnung gestellt, auch wenn Sie keine TPU-Ressourcen verwenden.
Sie können Ihre TPU-Knoten mit den folgenden TPU-Typen konfigurieren:
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Weitere Informationen zu den Unterschieden zwischen verschiedenen TPU-Versionen und -Konfigurationen finden Sie in der Dokumentation zur TPU-Systemarchitektur.
Kosten optimieren
Cloud TPU v4 bietet bis zu 35% Einsparungen bei Transformer-basierten Modellen und bis zu 50% bei ResNet im Vergleich zu A100 in Azure.
Die Einsparungen sind besonders aussagekräftig, da reale Modelle wie GPT-3 und PaLM viel größer sind als die BERT- und ResNet-Modelle, die in der MLPerf-Benchmark verwendet werden: PaLM ist ein 540-Milliarden-Parameter-Modell, während das in der MLPerf-Benchmark verwendete BERT-Modell nur 340 Millionen Parameter hat – eine Skalierung von 1.000. Basierend auf unseren Erfahrungen werden die Vorteile von TPUs mit der Größe erheblich wachsen und das Training für Cloud TPU v4 wird noch attraktiver.
Kosten abschätzen
Schätzen Sie die Kosten für die Verwendung von Cloud TPU mit dem Compute Engine-Preisrechner und wählen Sie in der oberen Leiste "Cloud TPU" aus.
Gleich loslegen
- Verwenden Sie das Registrierungsformular von Cloud TPU, um ein Kontingent zu erwerben und/oder mehr über Cloud TPU zu erfahren. Alternativ können Sie sich an unser Vertriebsteam wenden.
- Blogpost zur Einführung von Cloud TPU v4
- Ankündigung von TPU v4 von der Google I/O 2022
- Weitere Informationen zu den Ergebnissen der TPU v4-Datensatzeinstellung in MLPerf 2.0
- Auf der Seite zu den Richtlinien für Cloud TPU-Kontingente erfahren Sie, wie Sie Kontingente für verschiedene TPU-Typen anfordern können
- Regionen und Zonen ermitteln, in denen Cloud TPU verfügbar ist
- Versionshinweise zu zukünftigen Preisaktualisierungen lesen
- Lesen Sie die Cloud TPU-Dokumentation.
- Erste Schritte mit Cloud TPU.
- Informationen zu Cloud TPU-Lösungen und -Anwendungsfällen.