トレーニング方法の選択

このトピックでは、AutoML またはカスタム トレーニングを使用して Vertex AI でモデルをトレーニングすることと、BigQuery ML を使用してモデルをトレーニングすることの主な違いについて説明します。

AutoML では、最小限の技術的な作業でモデルを作成してトレーニングできます。AutoML を使用すると、開発に投資する前にモデルのプロトタイプを迅速に作成し、新しいデータセットを調査できます。たとえば、特定のデータセットに最適な特徴を確認するために使用できます。

カスタム トレーニングにより、目標とする結果に合わせて最適化されたトレーニング アプリケーションを作成できます。トレーニング アプリケーションの機能を完全に制御できます。つまり、設定する目標や使用するアルゴリズムに制限はなく、独自の損失関数や指標の作成など、さまざまなカスタマイズが可能です。

BigQuery ML を使用すると、BigQuery で直接 BigQuery データを使用してモデルをトレーニングできます。SQL コマンドを使用すると、モデルをすばやく作成し、それを使用してバッチ予測を取得できます。

各サービスに必要な機能と専門知識を比較するには、次の表をご覧ください。

AutoML カスタム トレーニング BigQuery ML
データ サイエンスに関する専門知識 不要。 必要。トレーニング アプリケーションの開発に加え、特徴量エンジニアリングなどデータの準備も行います。 不要。
プログラミング能力 不要。AutoML は、プログラミングを必要としません。 必要。トレーニング アプリケーションを開発します。 BigQuery ML でモデルを構築、評価、使用するために必要な SQL プログラミング能力。
モデルのトレーニングに要する時間 比較的短い。必要とされるデータの準備は比較的少なく、開発の必要はありません。 比較的長い。比較的多くのデータを準備する必要があり、トレーニング アプリケーションを開発する必要があります。 比較的短い。BigQuery ML が BigQuery の計算エンジンを利用することから、バッチ予測やモデルのトレーニングに必要なインフラストラクチャを構築する必要がないため、モデルの開発速度が上がります。これにより、トレーニング、評価、予測を迅速に行えます。
ML の目標に関する制限 あり。AutoML で定義済みの目標のいずれかをターゲットにする必要があります。 なし あり。
ハイパーパラメータ調整を使用してモデルのパフォーマンスを手動で最適化できるか できない。AutoML では、一部自動でハイパーパラメータ調整を行いますが、使用する値は変更できません。 できる。各トレーニングの実行時に、実験および比較目的でモデルを調整できます。 できる。BQML では、CREATE MODEL ステートメントを使用して ML モデルをトレーニングする際に、ハイパーパラメータ調整がサポートされます。
トレーニング環境をコントロールできるか 制限あり。画像と表形式のデータセットに対しては、トレーニングするノード時間の数と、トレーニングの早期停止を許可するかどうかを指定できます。 できる。Compute Engine のマシンタイプ、ディスクサイズ、ML フレームワーク、ノード数など、環境の各要素を指定できます。 できない。
データサイズの制限

あり。AutoML ではマネージド データセットを使用します。データサイズの制限は、データセットの種類によって異なります。詳細については、次のトピックのいずれかをご覧ください。

非マネージド データセットの場合、制限はありません。マネージド データセットには、Vertex AI で作成およびホストされ、AutoML モデルのトレーニングに使用されるマネージド データセット オブジェクトと同じ制限があります。 あり。BigQuery ML ではプロジェクトごとに割り当てが適用されます。詳細については、割り当てと上限をご覧ください。

次のステップ