このドキュメントでは、AutoML またはカスタム トレーニングを使用して Vertex AI でモデルをトレーニングすることと、BigQuery ML を使用してモデルをトレーニングすることの主な違いについて説明します。
AutoML では、最小限の技術的な作業でモデルを作成してトレーニングできます。AutoML を使用すると、開発に投資する前にモデルのプロトタイプを迅速に作成し、新しいデータセットを調査できます。たとえば、特定のデータセットに最適な特徴を確認するために使用できます。
カスタム トレーニングにより、目標とする結果に合わせて最適化されたトレーニング アプリケーションを作成できます。トレーニング アプリケーションの機能を完全に制御できます。つまり、設定する目標や使用するアルゴリズムに制限はなく、独自の損失関数や指標の作成など、さまざまなカスタマイズが可能です。
BigQuery ML を使用すると、BigQuery で直接 BigQuery データを使用してモデルをトレーニングできます。SQL コマンドを使用すると、モデルをすばやく作成し、それを使用してバッチ予測を取得できます。
各サービスに必要な機能と専門知識を比較するには、次の表をご覧ください。
AutoML | カスタム トレーニング | BigQuery ML | |
---|---|---|---|
データ サイエンスに関する専門知識 | 不要。 | 必要。トレーニング アプリケーションの開発に加え、特徴量エンジニアリングなどデータの準備も行います。 | 不要。 |
プログラミング能力 | 不要。AutoML は、プログラミングを必要としません。 | 必要。トレーニング アプリケーションを開発します。 | BigQuery ML でモデルを構築、評価、使用するために必要な SQL プログラミング能力。 |
モデルのトレーニングに要する時間 | 比較的短い。必要とされるデータの準備は比較的少なく、開発の必要はありません。 | 比較的長い。比較的多くのデータを準備する必要があり、トレーニング アプリケーションを開発する必要があります。 | 比較的短い。BigQuery ML が BigQuery の計算エンジンを利用することから、バッチ予測やモデルのトレーニングに必要なインフラストラクチャを構築する必要がないため、モデルの開発速度が上がります。これにより、トレーニング、評価、予測を迅速化できます。 |
ML の目標に関する制限 | あり。AutoML で定義済みの目標のいずれかをターゲットにする必要があります。 | なし | あり。 |
ハイパーパラメータ調整を使用してモデルのパフォーマンスを手動で最適化できるか | できない。AutoML では、一部自動でハイパーパラメータ調整を行いますが、使用する値は変更できません。 | できる。各トレーニングの実行時に、実験および比較目的でモデルを調整できます。 | できる。BQML では、CREATE MODEL ステートメントを使用して ML モデルをトレーニングする際に、ハイパーパラメータ調整がサポートされます。 |
トレーニング環境をコントロールできるか | 制限あり。画像と表形式のデータセットに対しては、トレーニングするノード時間の数と、トレーニングの早期停止を許可するかどうかを指定できます。 | できる。Compute Engine のマシンタイプ、ディスクサイズ、ML フレームワーク、ノード数など、環境の各要素を指定できます。 | できない。 |
データサイズの制限 |
あり。AutoML ではマネージド データセットを使用します。データサイズの制限は、データセットの種類によって異なります。詳細については、次のトピックのいずれかをご覧ください。 |
非マネージド データセットの場合、制限はありません。マネージド データセットには、Vertex AI で作成およびホストされ、AutoML モデルのトレーニングに使用されるマネージド データセット オブジェクトと同じ制限があります。 | あり。BigQuery ML ではプロジェクトごとに割り当てが適用されます。詳細については、割り当てと上限をご覧ください。 |
次のステップ
- 入門チュートリアルを選択して、Vertex AI Training を使ってみる。
- AutoML モデルのトレーニングで詳細を確認する。
- Python を使用したカスタム トレーニング ジョブの作成について確認する。