Dokumentation zur KI/ML-Orchestrierung in GKE
Optimierte KI-/ML-Arbeitslasten mit den Funktionen der Google Kubernetes Engine (GKE)-Plattformorchestrierung ausführen. Mit der Google Kubernetes Engine (GKE) können Sie eine robuste, produktionsreife KI‑/ML-Plattform mit allen Vorteilen von verwaltetem Kubernetes und den folgenden Funktionen implementieren:
- Infrastrukturorchestrierung, die GPUs und TPUs zum Trainieren und Bereitstellen einer großen Anzahl von Arbeitslasten unterstützt
- Flexible Einbindung in verteiltes Computing und Datenverarbeitungs-Frameworks
- Unterstützung mehrerer Teams in derselben Infrastruktur zur Maximierung der Auslastung von Ressourcen
Starten Sie Ihr nächstes Projekt mit einem Guthaben in Höhe von 300 $
Mit dem Guthaben für die kostenlose Testversion und der kostenlosen monatlichen Nutzung von mehr als 20 Produkten können Sie einen Proof of Concept erstellen und testen.
Mehr als 20 Produkte immer kostenlos nutzen
Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.
Dokumentationsressourcen
Offene Modelle in GKE bereitstellen
-
NEU!
LLM mithilfe von TPU Trillium (v6e) in GKE mit vLLM bereitstellen
-
Tutorial
Kurzanleitung: LLM mit einer einzelnen GPU in GKE bereitstellen
-
Tutorial
Gemma mit GPUs in GKE mit Hugging Face TGI bereitstellen
-
Tutorial
Gemma mit GPUs in GKE mit vLLM bereitstellen
-
Tutorial
Gemma mit GPUs in GKE mit NVIDIA Triton und TensorRT-LLM bereitstellen
-
Tutorial
Gemma mithilfe von TPUs in GKE mit JetStream bereitstellen
TPUs und GPUs in großem Umfang orchestrieren
-
Video
Einführung in Cloud TPUs für maschinelles Lernen
-
Video
Umfangreiches maschinelles Lernen auf Cloud TPUs mit GKE erstellen
-
Video
Large Language Models mit KubeRay auf TPUs bereitstellen
-
Blog
Maschinelles Lernen mit JAX in Kubernetes mit NVIDIA-GPUs
-
Blog
ML-Plattform mit Kubeflow und Ray in GKE erstellen
Kostenoptimierung und Joborchestrierung
-
NEU!
Referenzarchitektur für eine Batchverarbeitungsplattform in GKE
-
Blog
Leistungsstarker KI/ML-Speicher über lokale SSD-Unterstützung in GKE
-
Blog
Vereinfachte MLOps mithilfe von Weights und Biases mit der Google Kubernetes Engine
-
Best practice
Best Practices zum Ausführen von Batch-Arbeitslasten in GKE
-
Best practice
Kostenoptimierte Kubernetes-Anwendungen in GKE ausführen
-
Best practice
Verbesserung der Startzeit der stabilen Diffusion in GKE um das Vierfache