Google Kubernetes Engine(GKE)のプラットフォーム オーケストレーション機能を使用して、最適化された AI / ML ワークロードを実行します。Google Kubernetes Engine(GKE)を使用すると、マネージド型の Kubernetes と次の機能のメリットをすべて活用し、プロダクション レディかつ堅牢な AI / ML プラットフォームを実装できます。

  • 大規模なワークロードのトレーニングとサービングのために GPU と TPU をサポートするインフラストラクチャ オーケストレーション
  • 分散コンピューティングとデータ処理フレームワークの柔軟な統合
  • リソースを最大限に活用するため、同じインフラストラクチャで複数のチームをサポートする
このページでは、GKE の AI / ML 機能の概要と、GPU、TPU、Hugging Face TGI、vLLM、JetStream などのフレームワークを使用して GKE で最適化された AI / ML ワークロードを実行する方法について説明します。

ドキュメント リソース

クイックスタートやガイド、主なリファレンス、一般的な問題のヘルプをご覧いただけます。
Google Cloud Skills Boost のセルフペース トレーニング、ユースケース、リファレンス アーキテクチャ、コードサンプル、Google Cloud サービスの使用方法と接続方法の例をご覧ください。

関連動画

*Summary:* Mike Orosz, CISO at Vertiv, shares how the critical infrastructure solutions provider enhanced its security operations workflows with Google Cloud. Using Google Security Operations, Vertiv has accelerated and automated threat detection,

Discover essential strategies for safeguarding sensitive data in AI applications on this episode of Serverless Expeditions. Join Martin Omander and Aron Eidelman as they explore key concepts, best practices, and tools for protecting data throughout

BigQuery pipe syntax documentation → https://goo.gle/4dFaZrB Pipe syntax examples and reference guide → https://goo.gle/3U1wcF3 Blog: Introducing pipe syntax in BigQuery and Cloud Logging → https://goo.gle/3ZUr75l Writing complex SQL queries can be