PyTorch の統合

このページでは、Vertex AI の PyTorch 統合について説明します。また、Vertex AI で PyTorch を使用する方法を説明するリソースについて紹介します。Vertex AI の PyTorch 統合を使用すると、本番環境で PyTorch モデルのトレーニング、デプロイ、オーケストレーションを容易に行うことができます。

ノートブックでコードを実行する

Vertex AI には、ノートブックでコードを実行する方法として Colab Enterprise と Vertex AI Workbench という 2 つのオプションがあります。これらのオプションの詳細については、ノートブック ソリューションを選択するをご覧ください。

トレーニング用のビルド済みコンテナ

Vertex AI には、モデル トレーニング用にビルド済みの Docker コンテナ イメージが用意されています。これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、トレーニング コードで必要となる一般的な依存関係が含まれています。ビルド済みのトレーニング コンテナを使用する PyTorch バージョンと、ビルド済みのトレーニング コンテナでモデルをトレーニングする方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。

予測を提供するためのビルド済みコンテナ

Vertex AI には、バッチ予測とオンライン予測の両方を提供するビルド済みの Docker コンテナ イメージが用意されています。これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、予測コードで必要となる一般的な依存関係が含まれています。ビルド済みの予測コンテナを含む PyTorch バージョンと、ビルド済みの予測コンテナでモデルを提供する方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。

分散トレーニング

Vertex AI では、PyTorch モデルの分散トレーニングを実行できます。マルチワーカー トレーニングの場合、Reduction Server を使用して、all-reduce グループ演算に合わせてパフォーマンスをさらに最適化できます。Vertex AI での分散トレーニングの詳細については、分散トレーニングをご覧ください。

Vertex AI で PyTorch を使用するためのリソース

Vertex AI での PyTorch の詳細とそれを使用する方法については、次のリソースをご覧ください。

次のステップ

  • チュートリアル: Google Cloud コンソールから Vertex AI を使用して、Vertex AI のビルド済みコンテナ環境のいずれかで PyTorch 画像分類モデルをトレーニングする。

    このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、「ガイドを表示」をクリックしてください。

    ガイドを表示