Optimierte KI-/ML-Arbeitslasten mit den Funktionen der Google Kubernetes Engine (GKE)-Plattformorchestrierung ausführen. Mit der Google Kubernetes Engine (GKE) können Sie eine robuste, produktionsreife KI/ML-Plattform mit allen Vorteilen von verwaltetem Kubernetes und den folgenden Funktionen implementieren:

  • Infrastrukturorchestrierung für GPUs und TPUs zum Trainieren und Bereitstellen von Arbeitslasten in großem Umfang
  • Flexible Einbindung in verteiltes Computing und Datenverarbeitungs-Frameworks
  • Unterstützung mehrerer Teams in derselben Infrastruktur zur Maximierung der Auslastung von Ressourcen
Auf dieser Seite erhalten Sie einen Überblick über die KI-/ML-Funktionen von GKE und erfahren, wie Sie optimierte KI-/ML-Arbeitslasten mit GPUs, TPUs und Frameworks wie Hugging Face TGI, vLLM und JetStream in GKE ausführen.

Dokumentationsressourcen

Finden Sie Kurzanleitungen und Leitfäden, prüfen Sie wichtige Referenzen und erhalten Sie Hilfe bei häufigen Problemen.
Entdecken Sie Schulungen von Google Cloud Skills Boost, Anwendungsfälle, Referenzarchitekturen und Codebeispiele mit Details zur Verwendung und Verbindung von Google Cloud-Diensten.

Ähnliche Videos