カスタムトレーニング方法を選択する

AutoML の代わりに独自のトレーニングコードを作成する場合、いくつかのカスタムトレーニングを行うことを検討してください。このトピックでは、カスタムトレーニングを実行するさまざまな方法を簡単に説明します。

Vertex AI のカスタムトレーニングリソース

Vertex AI でカスタムモデルをトレーニングするために作成できる Vertex AI リソースには、次の 3 種類があります。

カスタムジョブを作成する場合、Vertex AI がトレーニングコードを実行するために必要な設定を指定します。次のような設定になります。

単一ノードトレーニング用のワーカープール（WorkerPoolSpec）または分散トレーニング用の複数のワーカープール
ジョブスケジューリングの構成のオプション設定（Scheduling）、トレーニングコード用の特定の環境変数の設定、カスタムサービスアカウントの使用、VPC ネットワークピアリングの使用

ワーカープールでは次の設定を指定できます。

マシンタイプとアクセラレータ
ワーカープールで実行するトレーニングコードの種類の構成: Python トレーニングアプリケーション（PythonPackageSpec）またはカスタムコンテナ（ContainerSpec）のいずれか

ハイパーパラメータ調整ジョブを構成するには、指標などの追加設定が必要です。詳しくは、ハイパーパラメータ調整をご覧ください。

トレーニングパイプラインは、追加のステップとしてカスタムトレーニングジョブまたはハイパーパラメータ調整ジョブをオーケストレートします。たとえば、トレーニングジョブが正常に完了した後に Vertex AI へのデータセットの読み込みやモデルのアップロードなどを行います。

カスタムトレーニングリソース

プロジェクト内の既存のトレーニングパイプラインを表示するには、Google Cloud Console で [Vertex AI] セクションの [TRAINING PIPELINE] ページに移動します。

[トレーニングパイプライン] に移動

プロジェクト内の既存のカスタムジョブを表示するには、[CUSTOM JOB] ページに移動します。

[CUSTOM JOB] に移動

プロジェクト内の既存のハイパーパラメータ調整ジョブを表示するには、[HYPERPARAMETER TUNING] ページに移動します。

[HYPERPARAMETER TUNING] に移動

ビルド済み / カスタムコンテナ

カスタムトレーニングジョブ、ハイパーパラメータ調整ジョブ、またはトレーニングパイプラインを Vertex AI に送信する前に、Python トレーニングアプリケーションまたはカスタムコンテナを作成して、Vertex AI で実行するトレーニングコードと依存関係を定義する必要があります。TensorFlow、PyTorch、scikit-learn、または XGBoost を使用して Python トレーニングアプリケーションを作成する場合は、ビルド済みのコンテナを使用してコードを実行できます。どちらを選択すべきか判断に迷う場合は、トレーニングコードの要件をご覧ください。

分散トレーニング

分散トレーニング用のカスタムトレーニングジョブ、ハイパーパラメータ調整ジョブ、またはトレーニングパイプラインを構成するには、複数のワーカープールを指定します。

最初のワーカープールを使用してプライマリレプリカを構成し、レプリカ数を 1 に設定します。
機械学習フレームワークが分散トレーニング用のこれらの追加クラスタタスクをサポートしている場合は、ワーカープールを追加して、ワーカーレプリカ、パラメータサーバーレプリカ、またはエバリュエータレプリカを構成します。

分散トレーニングの使用方法の詳細。

次のステップ

カスタムトレーニングジョブを実行する永続リソースの作成方法を学習する。
Vertex AI でカスタムトレーニングアプリケーションを実行するためのカスタムトレーニングジョブの作成方法については、カスタムトレーニングジョブの作成をご覧ください。
Vertex AI でカスタムトレーニングアプリケーションを実行するためのトレーニングパイプラインの作成方法については、トレーニングパイプラインの作成をご覧ください。
ハイパーパラメータ調整については、ハイパーパラメータ調整の使用をご覧ください。

カスタム トレーニング方法を選択する

Vertex AI のカスタム トレーニング リソース

カスタム トレーニング リソース

ビルド済み / カスタム コンテナ