このページでは、Vertex AI の PyTorch 統合について説明します。また、Vertex AI で PyTorch を使用する方法を説明するリソースについて紹介します。Vertex AI の PyTorch 統合を使用すると、本番環境で PyTorch モデルのトレーニング、デプロイ、オーケストレーションを容易に行うことができます。
ノートブックでコードを実行する
Vertex AI には、ノートブックでコードを実行する方法として Colab Enterprise と Vertex AI Workbench という 2 つのオプションがあります。これらのオプションの詳細については、ノートブック ソリューションを選択するをご覧ください。
トレーニング用のビルド済みコンテナ
Vertex AI には、モデル トレーニング用にビルド済みの Docker コンテナ イメージが用意されています。これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、トレーニング コードで必要となる一般的な依存関係が含まれています。ビルド済みのトレーニング コンテナを使用する PyTorch バージョンと、ビルド済みのトレーニング コンテナでモデルをトレーニングする方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。
予測を提供するためのビルド済みコンテナ
Vertex AI には、バッチ予測とオンライン予測の両方を提供するビルド済みの Docker コンテナ イメージが用意されています。これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、予測コードで必要となる一般的な依存関係が含まれています。ビルド済みの予測コンテナを含む PyTorch バージョンと、ビルド済みの予測コンテナでモデルを提供する方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。
分散トレーニング
Vertex AI では、PyTorch モデルの分散トレーニングを実行できます。マルチワーカー トレーニングの場合、Reduction Server を使用して、all-reduce グループ演算に合わせてパフォーマンスをさらに最適化できます。Vertex AI での分散トレーニングの詳細については、分散トレーニングをご覧ください。
Vertex AI で PyTorch を使用するためのリソース
Vertex AI での PyTorch の詳細とそれを使用する方法については、次のリソースをご覧ください。
- Vertex AI で PyTorch モデルのトレーニングとチューニングを行う方法: Vertex AI Training で PyTorch を使用して感情テキスト分類モデルを構築およびトレーニングする方法と、PyTorch モデルのハイパーパラメータをチューニングする Vertex AI ハイパーパラメータ チューニングについて説明します。
- Vertex AI に PyTorch モデルをデプロイする方法: Vertex AI Prediction サービスにモデル アーティファクトをデプロイすることで、TorchServe をカスタム コンテナとして使用し、Pytorch モデルをデプロイする方法について説明します。
- Vertex AI Pipelines での PyTorch ML ワークフローのオーケストレーション: Vertex AI Pipelines を使用して、Google Cloud Vertex AI 上で PyTorch モデルをトレーニングしてデプロイするための ML パイプラインを構築およびオーケストレートする方法について説明します。
- Kubeflow Pipelines と Vertex Pipelines 上の PyTorch を使用したスケーラブルな ML ワークフロー: OSS Kubeflow Pipelines(Kubeflow プロジェクトの一部)と Vertex AI Pipelines 上の PyTorch ベースの ML ワークフローの例を紹介します。また、Kubeflow Pipelines に追加された新しい PyTorch 組み込みコンポーネントについても説明します。
- Vertex AI のビルド済みコンテナを使用した PyTorch 画像モデルのサービング: このノートブックでは、ビルド済みの PyTorch サービング イメージを使用して、Vertex AI に PyTorch 画像分類モデルをデプロイします。
次のステップ
- チュートリアル: Google Cloud コンソールから Vertex AI を使用して、Vertex AI のビルド済みコンテナ環境のいずれかで PyTorch 画像分類モデルをトレーニングする。
このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、「ガイドを表示」をクリックしてください。