Google Kubernetes Engine(GKE)のプラットフォーム オーケストレーション機能を使用して、最適化された AI / ML ワークロードを実行します。Google Kubernetes Engine(GKE)を使用すると、マネージド型の Kubernetes と次の機能のメリットをすべて活用し、プロダクション レディかつ堅牢な AI / ML プラットフォームを実装できます。

  • 大規模なワークロードのトレーニングとサービングのために GPU と TPU をサポートするインフラストラクチャ オーケストレーション
  • 分散コンピューティングとデータ処理フレームワークの柔軟な統合
  • リソースを最大限に活用するため、同じインフラストラクチャで複数のチームをサポートする
このページでは、GKE の AI / ML 機能の概要と、GPU、TPU、Hugging Face TGI、vLLM、JetStream などのフレームワークを使用して GKE で最適化された AI / ML ワークロードを実行する方法について説明します。

ドキュメント リソース

クイックスタートやガイド、主なリファレンス、一般的な問題のヘルプをご覧いただけます。
Google Cloud Skills Boost のセルフペース トレーニング、ユースケース、リファレンス アーキテクチャ、コードサンプル、Google Cloud サービスの使用方法と接続方法の例をご覧ください。

関連動画