Dokumentation zur KI/ML-Orchestrierung in GKE
Optimierte KI-/ML-Arbeitslasten mit den Funktionen der Google Kubernetes Engine (GKE)-Plattformorchestrierung ausführen. Mit der Google Kubernetes Engine (GKE) können Sie eine robuste, produktionsreife KI‑/ML-Plattform mit allen Vorteilen von verwaltetem Kubernetes und den folgenden Funktionen implementieren:
- Infrastrukturorchestrierung, die GPUs und TPUs zum Trainieren und Bereitstellen einer großen Anzahl von Arbeitslasten unterstützt
- Flexible Einbindung in verteiltes Computing und Datenverarbeitungs-Frameworks
- Unterstützung mehrerer Teams in derselben Infrastruktur zur Maximierung der Auslastung von Ressourcen
Proof of Concept mit einem Guthaben in Höhe von 300 $starten
- Zugriff auf Gemini 2.0 Flash Thinking erhalten
- Kostenlose monatliche Nutzung beliebter Produkte wie KI-APIs und BigQuery
- Keine automatischen Abbuchungen, keine Verpflichtungen
Mehr als 20 Produkte immer kostenlos nutzen
Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.
Dokumentationsressourcen
Offene Modelle in GKE bereitstellen
-
NEU!
LLMs wie Deepseek-R1 671B oder Llama 3.1 405B in GKE bereitstellen
-
NEU!
LLM mithilfe von TPUs in GKE mit KubeRay bereitstellen
-
Tutorial
LLM mithilfe von TPU Trillium in GKE mit vLLM bereitstellen
-
Tutorial
Kurzanleitung: LLM mit einer einzelnen GPU in GKE bereitstellen
-
Tutorial
Gemma mit GPUs in GKE mit Hugging Face TGI bereitstellen
-
Tutorial
Gemma mit GPUs in GKE mit vLLM bereitstellen
TPUs und GPUs in großem Umfang orchestrieren
-
NEU!
GKE-Ressourcennutzung für gemischte KI/ML-Trainings- und Inferenzarbeitslasten optimieren
-
Video
Einführung in Cloud TPUs für maschinelles Lernen
-
Video
Umfangreiches maschinelles Lernen auf Cloud TPUs mit GKE erstellen
-
Video
Large Language Models mit KubeRay auf TPUs bereitstellen
-
Blog
Maschinelles Lernen mit JAX in Kubernetes mit NVIDIA-GPUs
Kostenoptimierung und Joborchestrierung
-
NEU!
Referenzarchitektur für eine Batchverarbeitungsplattform in GKE
-
Blog
Leistungsstarker KI/ML-Speicher über lokale SSD-Unterstützung in GKE
-
Blog
Vereinfachte MLOps mithilfe von Weights und Biases mit der Google Kubernetes Engine
-
Best practice
Best Practices zum Ausführen von Batch-Arbeitslasten in GKE
-
Best practice
Kostenoptimierte Kubernetes-Anwendungen in GKE ausführen
-
Best practice
Verbesserung der Startzeit der stabilen Diffusion in GKE um das Vierfache