このトピックでは、AutoML とカスタム トレーニングの主な違いを説明するため、どちらが適しているかを見極めることが可能です。
AutoML を使用すると、最小限の技術的な作業でモデルを作成してトレーニングできます。カスタム トレーニング アプリケーションが持つ柔軟性を希望する場合でも、AutoML を使用すると、迅速にモデルを試作して新しいデータセットを調査した後、開発に注力できます。たとえば、特定のデータセットに最適な特徴を確認するために使用できます。
カスタム トレーニングを使用すると、ターゲットの結果に対して最適化されたトレーニング アプリケーションを作成できます。トレーニング アプリケーションの機能を完全に制御できます。つまり、設定する目標や使用するアルゴリズムに制限はなく、独自の損失関数や指標の作成など、さまざまなカスタマイズが可能です。
AutoML とカスタム トレーニングの機能および必要な専門知識を簡単に比較するには、次の表をご覧ください。
AutoML | カスタム トレーニング | |
---|---|---|
データ サイエンスに関する専門知識 | 不要。 | 必要。トレーニング アプリケーションの開発に加え、特徴量エンジニアリングなどデータの準備も行います。 |
プログラミング能力 | 不要。AutoML は、プログラミングを必要としません。 | 必要。トレーニング アプリケーションを開発します。 |
モデルのトレーニングに要する時間 | 比較的短い。必要とされるデータの準備は比較的少なく、開発の必要はありません。 | 比較的長い。比較的多くのデータを準備する必要があり、トレーニング アプリケーションを開発する必要があります。 |
機械学習の目標に関する制限 | ある。AutoML で定義済みの目標のいずれかをターゲットにする必要があります。 | ない。 |
ハイパーパラメータ調整を使用してモデルのパフォーマンスを手動で最適化できる | できない。AutoML では、一部自動でハイパーパラメータ調整を行いますが、使用する値は変更できません。 | できる。各トレーニングの実行時に、実験および比較目的でモデルを調整できます。 |
トレーニング環境をコントロールできる | 制限あり。画像と表形式のデータセットに対しては、トレーニングするノード時間の数と、トレーニングの早期停止を許可するかどうかを指定できます。 | できる。Compute Engine のマシンタイプ、ディスクサイズ、機械学習フレームワーク、ノード数など、環境の各要素を指定できます。 |
データサイズの制限 |
あり。AutoML ではマネージド データセットを使用します。データサイズの制限は、データセットの種類によって異なります。詳細については、次のトピックのいずれかをご覧ください。 |
非マネージド データセットの場合、制限はありません。マネージド データセットには、AutoML モデルのトレーニングに使用される Vertex AI データセットと同じ制限があります。 |
次のステップ
- 入門チュートリアルを選択して、Vertex AI Training を使ってみる。
- Google Cloud コンソールまたは Vertex AI API を使用して AutoML モデルをトレーニングする方法を確認する。
- Python を使用したカスタム トレーニング ジョブの作成について確認する。