AI Hypercomputer

Trainieren und verwalten Sie Ihre KI-Anwendungen in der agentnativen Infrastruktur, die für Google-Produkte genutzt wird, und stellen Sie sie dort bereit.

AI Hypercomputer

Trainieren und verwalten Sie Ihre KI-Anwendungen in der agentnativen Infrastruktur, die für Google-Produkte genutzt wird, und stellen Sie sie dort bereit.

Neuigkeiten und Ereignisse

Lesen Sie, warum Google im Gartner®-Bericht „Magic Quadrant™ for AI Infrastructure“ als einer der führenden Anbieter eingestuft wurde.
Lesen Sie den Bericht und erfahren Sie, warum der AI Hypercomputer hinsichtlich Ausführung und Vision am weitesten vorne liegt.
Aktuelle Neuigkeiten zu TPUs
Melden Sie sich für unsere Mailingliste an, um als Erstes über neue TPU-Einführungen und Veranstaltungen informiert zu werden.
Ihre Entwickler mit einer globalen Community verbinden
Unsere Google Cloud × NVIDIA-Community hat gerade die Marke von 100.000 Mitgliedern überschritten. Hier können sich Entwickler austauschen, ihr Wissen teilen und von anderen lernen.

Die Zukunft der KI-Infrastruktur

AI Hypercomputer ist eine Architektur, die speziell entwickelte Hardware, offene Software und flexible Verbrauchsmodelle kombiniert. Die einzelnen Komponenten wurden sorgfältig eingebunden, um gut mit den anderen zusammenzuarbeiten und so Leistung, Kosten und Entwicklerproduktivität zu verbessern.

32:53

Intelligenteres und schnelleres Training

Modelle in Wochen statt Monaten erstellen. Mit dem Trainings-Stack von Google können Sie Entwicklung und Tests beschleunigen, ohne die Leistung zu beeinträchtigen.

Video-Thumbnail „TPU 8t und 8i im Detail“

11:08

LLMs schneller trainieren und abstimmen

Mit der TPU 8t und der von Google DeepMind mitentwickelten Software, die in Open-Source-Frameworks integriert ist – von Pathways bis Pallas (Training) und von Ray bis Agent Sandbox (Abstimmung) – können Sie LLMs 36 % schneller entwickeln und die Produktivität (Goodput) jedes Beschleunigers um bis zu 97 % steigern. Wir wissen auch, dass es nicht die eine Lösung für alle gibt. Deshalb arbeiten wir eng mit NVIDIA zusammen, um die neuesten GPUs anzubieten. Google Cloud wird zu den ersten Anbietern gehören, die Instanzen auf Basis der NVIDIA Vera Rubin NVL72 der nächsten Generation bereitstellen, sobald diese im Laufe dieses Jahres verfügbar werden.

Leistungsstarke Modelle mit proprietären Daten trainieren

Mit der Gemini Enterprise Agent Platform und BigQuery können Sie Modelle mit proprietären Daten 16-mal schneller trainieren, indem Sie Ihre Datenbestände, die ML-Entwicklung und Beschleuniger an einem Ort zusammenführen. Beide werden vom AI Hypercomputer unterstützt, unabhängig davon, ob Sie G4-VMs oder Ironwood-TPUs verwenden.

Adaptive physische Agenten mit MuJoCo-Warp erstellen

GPU-basierte Simulationen mit MuJoCo-Warp von DeepMind ausführen – bis zu 100-mal schneller als mit dem Standard-MuJoCo. Anschließend können Sie mit synthetischen Medien von Veo, Genie und Nano Banana unmögliche, riskante oder teure Grenzfälle simulieren oder Petabyte an realen Sensordaten in BigQuery aufnehmen. Hier erfahren Sie mehr über das Erstellen physischer Agenten in Google Cloud.

Schnelle, effiziente Inferenz

Sie erhalten validierte Modellprofile sowie vollständig integrierte Google- und Open-Source-Software, um die Reaktionsfähigkeit von Anwendungen zu verbessern und gleichzeitig Komplexität und Verschwendung zu reduzieren.

LLMs mit nahezu latenzfreier Bereitstellung

Dank eingebundener Inferenztechnologien können Sie Ihren Kunden nützliche, reaktionsschnelle Dienste anbieten. Mit GKE Inference Gateway lässt sich die Zeit bis zum ersten Token um 71 % verkürzen. Mit llm-d für die disaggregierte Bereitstellung können bis zu 120.000 Tokens pro Sekunde bereitgestellt werden. Und mit Rapid Cache und TPU 8i lassen sich Modelle fünfmal schneller laden, sodass der Arbeitsspeicher genau dort zur Verfügung steht, wo er benötigt wird.

Vordefinierte Modelle für visuelle Daten, Wahrnehmung und Medien bereitstellen

Klassische ML-Modelle lassen sich 70 % schneller bereitstellen, wenn Sie eines der über 200 Modelle auf der Gemini Enterprise Agent Platform verwenden. Dabei können Sie zwischen TPU und GPU wählen, einschließlich A5X-VMs (NVIDIA Vera Rubin) und TPU 8i, sobald diese im Laufe des Jahres verfügbar sind.

KI-Agenten sicher und kosteneffizient bereitstellen

In der GKE Agent Sandbox können Sie Asichergentenschwärme sicher bereitstellen. Dabei stehen pro Sekunde bis zu 300 Sandboxes zur Verfügung. Sie können sie bei Bedarf umgehend pausieren oder fortsetzen, sodass Sie nie für inaktive Agenten bezahlen.

Flexibler, offener und zuverlässiger Betrieb

Sie können jedes Framework oder jeden Accelerator in Hybrid- und Multi-Cloud-Umgebungen mit automatisierter Clusterwartung und ‑verwaltung für Exascale-Anforderungen verwenden.

Zwischen TPUs und GPUs wechseln, ohne Code neu zu schreiben

TorchTPU bietet nativen PyTorch-Support, sodass Entwickler die TPU-Lernkurve überspringen und den besten verfügbaren Beschleuniger ohne komplexe Code-Neuschreibungen verwenden können.

KI in jeder Umgebung und in nahezu jeder Größenordnung bereitstellen

GKE basiert auf dem Open-Source-System Kubernetes und bietet Ihnen Multicloud-Portabilität in Unternehmensdimensionen. Es unterstützt bis zu 130.000 Knoten und lässt sich nativ in die Agent Platform und Google Distributed Cloud für hybride Bereitstellungen einbinden.

Clusterwartung mit erweiterten Clusterdiagnose- und Beobachtbarkeitstools automatisieren

Jeder Beschleuniger auf AI Hypercomputer wird durch Cluster Director-Funktionen unterstützt, darunter ein Zustandsbericht vor der Bereitstellung, 360-Grad-Dashboards zur Beobachtbarkeit und fortlaufende Zustandsprüfungen.

Multicloud-Arbeitslasten in wenigen Minuten statt Wochen verbinden

Mit Cross-Cloud Network, einem Netzwerk-Backbone, dem über 65 % der Fortune-100-Unternehmen vertrauen und der monatlich über 27 Exabyte an Daten überträgt, können Sie Dienste in verschiedenen Clouds ohne Verzögerungen verbinden.

Beschleunigerkapazität nach Bedarf

Unsere flexiblen Verbrauchsmodelle bieten Ihnen mehrere Möglichkeiten, die Kosten für Beschleuniger zu planen und zu senken. Mit Spot-VMs können Sie bis zu 91 % bei Batch- oder fehlertoleranten Jobs sparen, mit dem Dynamic Workload Scheduler bis zu 50 % bei Jobs mit flexiblem Startdatum und mit Rabatten für zugesicherte Nutzung bis zu 50 %.

Für den Einsatz von KI-Agenten geeignete Systeme

Sie können die Leistungsgrenzen ausreizen und Energie verantwortungsbewusst nutzen, während Sie auf der Infrastruktur aufbauen, auf die Google und führende KI-Labore vertrauen.

KI-Roadmap auf einer vertrauenswürdigen Grundlage umsetzen

Google Cloud unterstützt 9 von 10 der führenden KI-Labore und 70 % der finanzierten KI-Start-ups. Wenn Sie AI Hypercomputer verwenden, nutzen Sie Rechenzentren, die allein im Dezember 2025 zuverlässig über 100 Milliarden Tokens für fast 350 Kunden verarbeitet haben.

Branchenführende Energieeffizienz

Die Rechenzentren von Google Cloud, einschließlich des AI Hypercomputers, bieten eine branchenführende Energieeffizienz und liefern sechsmal mehr Rechenleistung pro Stromeinheit als noch vor fünf Jahren. Dadurch bietet unsere TPU der 8. Generation ein 80 % besseres Preis-Leistungs-Verhältnis und ist 20 % energieeffizienter als die vorherige Generation.

Auswirkungen auf das Stromnetz und die Gemeinden reduzieren

Wir verpflichten uns dazu, 100 % des Stroms, den unsere Rechenzentren verbrauchen, und alle neuen Infrastrukturkosten, die direkt durch unser Wachstum entstehen, zu bezahlen. Arbeiten Sie mit uns zusammen, damit die Kosten für Ihre KI-Ambitionen nicht auf die lokalen Haushalte und Unternehmen abgewälzt werden. In den kommenden Jahren werden wir neue Energiequellen und Infrastruktur für unsere Modelle finanzieren und weiterhin in alternative Energiequellen wie fortschrittliche Kernenergie, Geothermie und Langzeitspeicher investieren.

Ihr wertvollstes geistiges Eigentum von Siliziumchips bis zum Edge-Netzwerk schützen

Die Titanium-Architektur mit den eigens entwickelten Titan-Chips bietet eine überprüfbare Hardware-Root-of-Trust-Komponente und Zero-Trust-Sicherheit. Eine unabhängige Analyse von cloudvulndb.org zeigt, dass unsere Systeme bis zu 70% weniger kritische Sicherheitslücken aufweisen als andere führende Clouds.

Unterstützt die weltweit führenden Innovatoren

Wie WPP das Training humanoider Roboter mit G4-VMs um das 10-Fache beschleunigt

WPP hat das Training humanoider Roboter durch den Einsatz von G4-VMs von Google Cloud und NVIDIA Isaac Sim deutlich optimiert und die Zyklen des bestärkenden Lernens von 24 Stunden auf weniger als eine Stunde reduziert. Durch das Meistern komplexer menschlicher Bewegungen wie Tanzen in der Simulation schließen sie die Lücke zwischen Simulation und Realität, um präzisere und natürlichere Roboterbewegungen für die Film- und Marketingbranche zu ermöglichen.

Weiter eintauchen

KI macht Sportfans zu Trikotdesignern

PUMA hat sich für eine integrierte KI-Infrastruktur (AI Hypercomputer) von Google Cloud entschieden. So kann das Unternehmen Gemini für Nutzerprompts und Dynamic Workload Scheduler für die dynamische Skalierung von Inferenz auf GPUs nutzen, was Kosten und Generierungszeit erheblich reduziert.

3:20

Weiter eintauchen

Frontline-Beschäftigte in Fabriken ohne Programmierkenntnisse beim Erstellen eigener KI-Lösungen unterstützen

Toyota hat sich für Google Cloud entschieden, weil die Skalierungsleistung der Google Kubernetes Engine einzigartig ist – in den Tests des Unternehmens war sie viermal schneller als die der Konkurrenz. Das war die entscheidende Geschwindigkeit und Reaktionsfähigkeit, die erforderlich war, um KI für die Mitarbeiter in der Produktion erfolgreich zu demokratisieren.

Weiter eintauchen

Ein leistungsstarkes, zweisprachiges Foundation Model entwickeln, um komplexe Geschäftsprobleme zu lösen

Die Lösung beschleunigte die KI-Entwicklung, steigerte die Leistung um das 1,3‑Fache und ermöglichte eine sichere, unternehmensweite Zusammenarbeit zwischen Mensch und KI in allen Tochtergesellschaften von LG.

2:46

Weiter eintauchen

Major League Baseball bietet Teams und Fans mit Agents auf AI Hypercomputer schnellere Dienste

Major League Baseball hat mit AI Hypercomputer KI-Agents entwickelt und so die Entwicklungszeit von Monaten auf Wochen und die Incident Response von Stunden auf Sekunden verkürzt.

3:19

Weiter eintauchen

Weitere Informationen zum AI Hypercomputer

Analystenmeinungen

Anleitungen

Dokumentation

Optionen für Bereitstellung und Orchestrierung
In diesem Video werden zwei Optionen für die KI-Orchestrierung und Clusterverwaltung in Google Cloud vorgestellt: der cloudnative Ansatz mit der Google Kubernetes Engine (GKE) und ein leistungsstarker Ansatz mit Slurm und Cluster Director.
Video (3:39)
Video ansehen

KI-Einstieg – noch heute beginnen

Wenden Sie sich an eine unserer Fachkräfte für Infrastruktur, um Ideen zu sammeln, Ihr nächstes Projekt zu besprechen oder eine Demo anzusehen.