ML- und DL-Modelltraining mit AI Infrastructure

Webinar: Den Code der generativen KI knacken: Infrastrukturtrends und Strategien für den Erfolg. 25. Juni, 10:00 Uhr PDT.Jetzt anmelden.

Weiter zu

AI Infrastructure

Skalierbare, leistungsstarke und kostengünstige Infrastruktur für beliebige KI-Arbeitslasten.

Kontakt

KI-Beschleuniger für jeden Anwendungsfall – von Hochleistungstraining bis hin zu kostengünstiger Inferenz
Mit GPUs und TPUs in Google Kubernetes Engine oder Google Compute Engine schneller skalieren
Bereitstellbare Lösungen für Vertex AI, Google Kubernetes Engine und das Cloud-HPC-Toolkit
Um unsere KI-Infrastruktur optimal zu nutzen sollten Sie die KI-Hypercomputer-Architektur bereitstellen.

Google wird im Bericht „The Forrester Wave for AI Infrastructure“ als einer der führenden Anbieter genannt

Weitere Informationen

Vorteile

Leistung und Kosten in großem Umfang optimieren

Bei Google Cloud können Sie unter GPUs, TPUs und CPUs wählen, um verschiedenste Anwendungsfällen zu unterstützen, darunter Hochleistungstraining, kostengünstige Inferenz und Datenverarbeitung im großen Maßstab.

Mit einer verwalteten Infrastruktur schneller Ergebnisse erzielen

Mit der verwalteten Infrastruktur von Vertex AI können Sie schneller und effizienter skalieren. Richten Sie schnell ML-Umgebungen ein, automatisieren Sie die Orchestrierung, verwalten Sie große Cluster und richten Sie Anwendungen mit niedriger Latenz ein.

Entwicklung mit speziell für KI entwickelter Software

Verbessern Sie die Produktivität der KI-Entwicklung, indem Sie mit GKE umfangreiche Arbeitslasten verwalten. Trainieren und stellen Sie die Foundation Models mit Unterstützung für Autoscaling, Arbeitslast-Orchestrierung und automatische Upgrades bereit.

Wichtige Features

Flexible und skalierbare Hardware für jeden Anwendungsfall

Bei KI-Arbeitslasten gibt es keine Universallösung. Deshalb bieten wir zusammen mit unseren Hardwarepartnern aus der Branche, darunter NVIDIA, Intel, AMD, Arm und mehr, unseren Kunden ein breites Spektrum an KI-optimierten Computing-Optionen für TPUs, GPUs und CPUs zum Trainieren und Bereitstellen sehr datenintensiver Modelle.

Einfach zu bedienen, zu verwalten und zu skalieren

Das Orchestrieren umfangreicher KI-Arbeitslasten mit Cloud TPUs und Cloud GPUs war in der Vergangenheit mit manuellem Aufwand verbunden, um Fehler, Logging, Monitoring und andere grundlegende Vorgänge zu bewältigen. Die Google Kubernetes Engine (GKE), ein sehr gut skalierbarer und vollständig verwalteter Kubernetes-Dienst, vereinfacht die für den Betrieb von TPUs und GPUs erforderliche Arbeit erheblich. Der Einsatz von GKE zur Verwaltung umfangreicher KI-Arbeitslast-Orchestrierung auf Cloud TPU und Cloud GPU verbessert die Produktivität der KI-Entwicklung.

Für Unternehmen, die es bevorzugen, die Infrastruktur einfach durch verwaltete Dienste zu abstrahieren, unterstützt Vertex AI jetzt das Training mit verschiedenen Frameworks und Bibliotheken über Cloud TPU und Cloud GPU.

Exponentielle Skalierung Ihrer KI-Modelle

Unsere KI-optimierte Infrastruktur wurde dafür entwickelt, die globale Skalierung und Leistung bereitzustellen, die von Milliarden Menschen genutzte Google-Produkte wie YouTube, Gmail, Google Maps, Google Play und Android erfordern. Unsere KI-Infrastrukturlösungen basieren alle auf dem Jupiter-Rechenzentrumsnetzwerk von Google Cloud, das eine branchenführende Hochskalierung von grundlegenden Diensten bis hin zu hochintensiven KI-Arbeitslasten unterstützt.

Äußerst flexible und offene Plattform

Seit Jahrzehnten arbeiten wir an wichtigen KI-Projekten wie TensorFlow und JAX mit. Wir haben die PyTorch Foundation mitbegründet und kürzlich ein neues Branchenkonsortium angekündigt: das OpenXLA-Projekt. Darüber hinaus leistet Google zahlreiche CNCF-Open-Source-Beiträge und leistet seit über 20 Jahren OSS-Beiträge wie TFX, MLIR, OpenXLA, KubeFlow und Kubernetes. Google sponsert OSS-Projekte, die für die Data-Science-Community von entscheidender Bedeutung sind, darunter Project Jupyter und NumFOCverteUS.

Außerdem sind unsere KI-Infrastrukturdienste in die gängigsten KI-Frameworks wie TensorFlow, PyTorch und MXNet eingebettet. Kunden können also weiterhin ihr bevorzugtes Framework verwenden und sind nicht auf ein bestimmtes Framework oder eine bestimmte Hardwarearchitektur beschränkt.

Grafik: Erweiterte Partnerschaft zwischen Google Cloud und NVIDIA

BLOG

Ankündigung: TPU v5p und KI-Hypercomputer

Kunden

Kunden, die die KI-Infrastruktur von Google Cloud nutzen

KI öffnet für Innovationen in verschiedenen Branchen Türen. Daher entscheiden sich Unternehmen für Google Cloud, um von unserer offenen, flexiblen und leistungsfähigen Infrastruktur zu profitieren.

News

Anthropic geht Partnerschaft mit Google Cloud ein, um zuverlässige, verantwortungsbewusste KI bereitzustellen

Lesezeit: 5 Minuten

Blog post

Wie Cohere das Training von Sprachmodellen mit Google Cloud TPUs beschleunigt

Lesezeit: 10 Minuten

News

Midjourney nutzt Google Cloud für die KI-generierte Creative-Plattform

Lesezeit: 5 Minuten

Blog post

Wie Osmo Gerüche mit der KI-Technologie von Google Cloud digitalisiert

Lesezeit: 5 Minuten

Blog post

AI21 nutzt die Google Cloud-Infrastruktur mit GPUs und TPUs für Training und Inferenz

Lesezeit: 5 Minuten

Alle Kunden ansehen

Das ist neu

Breakout-Session bei der Google Next '24 zu Cloud TPU v5e

Video

Mit dem KI-Hypercomputer von Google Cloud umfangreiche KI-Funktionen von der Forschung bis zur Produktion nutzenVideo ansehen

Blog post

Neu: Für KI maßgeschneiderte A3-Supercomputer mit NVIDIA H100-GPUsBlog lesen

Blog post

Erste Schritte mit Ray in Google Kubernetes EngineBlog lesen

Blog post

KI-Anwendungsfälle am Edge erstellen und ausführenBlog lesen

Blog post

TensorFlow in GKE Autopilot mit GPU-BeschleunigungBlog lesen

Blog post

AlphaFold-Batch-Inferenz mit Vertex AI Pipelines ausführenBlog lesen

Dokumentation

Google Cloud Basics

AI Infrastructure-Tools in GKE

Optimierte KI-/ML-Arbeitslasten mit den Funktionen der Google Kubernetes Engine (GKE)-Plattformorchestrierung ausführen

Weitere Informationen

Google Cloud Basics

Deep-Learning-VM-Images

Deep Learning VM Images sind für Data-Science- und ML-Aufgaben optimiert. Sie enthalten vorinstallierte zentrale ML-Frameworks und -Tools und können mit GPUs verwendet werden.

Weitere Informationen

Google Cloud Basics

Deep Learning Container

Deep Learning Container sind leistungsoptimierte, konsistente Umgebungen, die Sie beim Erstellen von Prototypen und bei der schnellen Implementierung von Workflows auf CPUs oder GPUs unterstützen.

Weitere Informationen

Tutorial

Wie werden Tensor Processing Units für KI/ML optimiert?

Hier erfahren Sie mehr über die Rechenanforderungen von Machine Learning und darüber, wie TPUs speziell für diese Aufgaben entwickelt wurden.

Weitere Informationen

Google Cloud Basics

TPU-Systemarchitektur

TPUs sind von Google speziell entwickelte ASICs, die dazu dienen, ML-Arbeitslasten zu beschleunigen. Lernen Sie die zugrunde liegende Systemarchitektur von TPUs von Grund auf kennen.

Weitere Informationen

Suchen Sie nach etwas anderem?

Gesamte Produktdokumentation lesen

Anwendungsfälle

KI-Hypercomputerarchitektur

Anwendungsfall

Umfangreiches KI-Training beschleunigen

Das Cloud TPU-Multislice-Training ist eine Full-Stack-Technologie, die ein schnelles, einfaches und zuverlässiges Training großer KI-Modelle mit Zehntausenden TPU-Chips ermöglicht.

Google Cloud basics

KI-Training mit Cloud TPU Multislice skalieren

Cloud TPU Multislice ist eine umfassende Full-Stack-Trainingstechnologie, die eine einfache, kostengünstige und nahezu lineare Skalierung auf Zehntausende Chips ermöglicht.

Weitere Informationen

Quickstart

Mit dem NVIDIA Nemo Framework in großem Maßstab trainieren

Hier erfahren Sie, wie Sie das Google Cloud HPC-Toolkit zusammen mit dem NVIDIA NEMO-Framework für verteiltes Training bereitstellen.

Weitere Informationen

Anwendungsfall

KI-gestützte Anwendungen bereitstellen

Mit der offenen Softwareumgebung von Google Cloud können Sie Anwendungen mit den Tools und Frameworks erstellen, mit denen Sie sich am besten auskennen. Gleichzeitig profitieren Sie von den Preis-Leistungs-Vorteilen der KI-Hypercomputerarchitektur.

Google Cloud basics

KI in vollständig verwalteter GKE ausführen

Die Google Kubernetes Engine im Autopilot-Modus ist eine beliebte Methode zum Ausführen von KI-Arbeitslasten wie Training und LLM-Bereitstellung (Large Language Model).

Weitere Informationen

Google Cloud basics

Erste Schritte mit Ray in Google Kubernetes Engine

Ray.io ist ein Open-Source-Framework zum einfachen Hochskalieren von Python-Anwendungen über mehrere Knoten in einem Cluster hinweg.

Weitere Informationen

Anwendungsfall

Maximales Preis-Leistungs-Verhältnis für die Bereitstellung von KI in großem Maßstab

Cloud TPU v5e- und NVIDIA L4-GPUs ermöglichen leistungsstarke und kostengünstige Inferenzen für verschiedene KI-Arbeitslasten, einschließlich der neuesten LLMs und generative AI-Modelle. Beide bieten erhebliche Preisleistungsverbesserungen im Vergleich zu früheren Modellen. Mit der KI-Hypercomputerarchitektur von Google Cloud können Kunden ihre Bereitstellungen auf branchenführende Levels skalieren.

Google Cloud basics

Cloud TPU v5e beschleunigt umfangreiche KI-Inferenzen

Mit Google Cloud TPU können Unternehmen Inferenzen auf hochmoderne KI-Modelle schneller, in größerem Umfang und zu geringeren Kosten ausführen.

Weitere Informationen

Quickstart

Modell mit GKE auf einer einzelnen GPU bereitstellen

Hier erfahren Sie, wie Sie mit GKE offene Modelle mithilfe einer einzelnen GPU bereitstellen.

Weitere Informationen

Google Cloud basics

Bereitstellung von Modellen für mehrere GPUs skalieren

Hier erfahren Sie, wie Sie die Bereitstellung eines gemeinsamen Open-Source-Modells über mehrere GPUs in GKE skalieren.

Weitere Informationen

Alle technischen Anleitungen ansehen

Preise

Die Preise für AI Infrastructure hängen von den ausgewählten Produkten ab. Sie können die KI-Infrastruktur von Google kostenlos mit Colab oder der kostenlosen Stufe von Google Cloud nutzen.

Cloud TPU	Cloud GPU
Informationen zu Preisen für verschiedene TPU-Einzelgeräte und TPU-Pods finden Sie unter TPU-Preise.	Informationen zu den Preisen für die verschiedenen verfügbaren GPU-Typen und Regionen finden Sie in der Preisübersicht für GPUs.

KI-Produkte von Google Cloud entsprechen unseren SLA-Richtlinien. Sie bieten eventuell von anderen Google Cloud-Diensten abweichende Latenz- oder Verfügbarkeitsgarantien.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.

Google Cloud kostenlos testen

Benötigen Sie Hilfe beim Einstieg?
Vertrieb kontaktieren
Mit einem zertifizierten Partner arbeiten
Partner finden
Mehr ansehen
Alle Produkte ansehen

AI Infrastructure

Leistung und Kosten in großem Umfang optimieren

Mit einer verwalteten Infrastruktur schneller Ergebnisse erzielen

Entwicklung mit speziell für KI entwickelter Software

Wichtige Features

Flexible und skalierbare Hardware für jeden Anwendungsfall

Einfach zu bedienen, zu verwalten und zu skalieren

Exponentielle Skalierung Ihrer KI-Modelle

Äußerst flexible und offene Plattform

Kunden, die die KI-Infrastruktur von Google Cloud nutzen

Das ist neu

Dokumentation

AI Infrastructure-Tools in GKE

Deep-Learning-VM-Images

Deep Learning Container

Wie werden Tensor Processing Units für KI/ML optimiert?

TPU-Systemarchitektur

Suchen Sie nach etwas anderem?

KI-Hypercomputerarchitektur

Umfangreiches KI-Training beschleunigen

KI-gestützte Anwendungen bereitstellen

Maximales Preis-Leistungs-Verhältnis für die Bereitstellung von KI in großem Maßstab

Preise

Gleich loslegen

Benötigen Sie Hilfe beim Einstieg?

Mit einem zertifizierten Partner arbeiten

Mehr ansehen