PyTorch の統合

このページでは、Vertex AI の PyTorch 統合について説明します。また、Vertex AI で PyTorch を使用する方法を説明するリソースについて紹介します。Vertex AI の PyTorch 統合を使用すると、本番環境で PyTorch モデルのトレーニング、デプロイ、オーケストレーションを容易に行うことができます。

ノートブックでコードを実行する

Vertex AI には、ノートブックでコードを実行する方法として Colab Enterprise と Vertex AI Workbench という 2 つのオプションがあります。これらのオプションの詳細については、ノートブックソリューションを選択するをご覧ください。

トレーニング用のビルド済みコンテナ

Vertex AI には、モデルトレーニング用にビルド済みの Docker コンテナイメージが用意されています。これらのコンテナは ML フレームワークとフレームワークバージョン別に編成され、トレーニングコードで必要となる一般的な依存関係が含まれています。ビルド済みのトレーニングコンテナを使用する PyTorch バージョンと、ビルド済みのトレーニングコンテナでモデルをトレーニングする方法については、カスタムトレーニング用のビルド済みコンテナをご覧ください。

予測を提供するためのビルド済みコンテナ

Vertex AI には、バッチ予測とオンライン予測の両方を提供するビルド済みの Docker コンテナイメージが用意されています。これらのコンテナは ML フレームワークとフレームワークバージョン別に編成され、予測コードで必要となる一般的な依存関係が含まれています。ビルド済みの予測コンテナを含む PyTorch バージョンと、ビルド済みの予測コンテナでモデルを提供する方法については、カスタムトレーニング用のビルド済みコンテナをご覧ください。

分散トレーニング

Vertex AI では、PyTorch モデルの分散トレーニングを実行できます。マルチワーカートレーニングの場合、Reduction Server を使用して、all-reduce グループ演算に合わせてパフォーマンスをさらに最適化できます。Vertex AI での分散トレーニングの詳細については、分散トレーニングをご覧ください。

Vertex AI で PyTorch を使用するためのリソース

Vertex AI での PyTorch の詳細とそれを使用する方法については、次のリソースをご覧ください。

Vertex AI で PyTorch モデルのトレーニングとチューニングを行う方法: Vertex AI Training で PyTorch を使用して感情テキスト分類モデルを構築およびトレーニングする方法と、PyTorch モデルのハイパーパラメータをチューニングする Vertex AI ハイパーパラメータチューニングについて説明します。
Vertex AI に PyTorch モデルをデプロイする方法: Vertex AI Prediction サービスにモデルアーティファクトをデプロイすることで、TorchServe をカスタムコンテナとして使用し、Pytorch モデルをデプロイする方法について説明します。
Vertex AI Pipelines での PyTorch ML ワークフローのオーケストレーション: Vertex AI Pipelines を使用して、Google Cloud Vertex AI 上で PyTorch モデルをトレーニングしてデプロイするための ML パイプラインを構築およびオーケストレートする方法について説明します。
Kubeflow Pipelines と Vertex Pipelines 上の PyTorch を使用したスケーラブルな ML ワークフロー: OSS Kubeflow Pipelines（Kubeflow プロジェクトの一部）と Vertex AI Pipelines 上の PyTorch ベースの ML ワークフローの例を紹介します。また、Kubeflow Pipelines に追加された新しい PyTorch 組み込みコンポーネントについても説明します。
Vertex AI のビルド済みコンテナを使用した PyTorch 画像モデルのサービング: このノートブックでは、ビルド済みの PyTorch サービングイメージを使用して、Vertex AI に PyTorch 画像分類モデルをデプロイします。

次のステップ

チュートリアル: Google Cloud コンソールから Vertex AI を使用して、Vertex AI のビルド済みコンテナ環境のいずれかで PyTorch 画像分類モデルをトレーニングする。

このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、「ガイドを表示」をクリックしてください。

ガイドを表示