独自のモデルをトレーニングして使用する

このページでは、Vertex AI で独自のモデルをトレーニングして使用するためのワークフローの概要について説明します。Vertex AI では、モデルのトレーニングに次の 2 つの方法がサポートされています。

AutoML: 最小限の技術的知識と労力でモデルを作成してトレーニングします。AutoML の詳細については、AutoML 初心者向けガイドをご覧ください。
カスタムトレーニング: 任意の ML フレームワークを使用して、大規模なモデルの作成とトレーニングを行います。Vertex AI でのカスタムトレーニングについて詳しくは、カスタムトレーニングの概要をご覧ください。

どの方法を使用するかを決定する方法については、トレーニング方法を選択するをご覧ください。

AutoML

ML モデルでは、トレーニングデータを使用して、トレーニングされていないデータの結果をモデルが推測する方法を確認します。Vertex AI の AutoML では、ユーザーが提供するトレーニングデータに基づいて、コード不要のモデルを構築できます。

AutoML で作成できるモデルの種類

構築できるモデルの種類はデータのタイプによって異なります。Vertex AI は、次のデータ型とモデルの目的に対応する AutoML ソリューションを提供します。

データのタイプ	サポートされる目的
画像データ	分類、オブジェクト検出
動画データ	動作認識、分類、オブジェクトトラッキング
テキストデータ	分類、エンティティ抽出、感情分析
表形式データ	分類 / 回帰、予測。

AutoML モデルのトレーニングと使用のワークフローは、データ型や目的に関係なく同じです。

トレーニングデータを準備する。
データセットを作成する。
モデルをトレーニングする。
モデルの評価と反復処理を行う。
モデルから予測を取得する。
予測結果を解釈する。

画像データ

AutoML は、機械学習を使用して画像データのコンテンツを分析します。AutoML を使用すると、画像データを分類する ML モデルをトレーニングできます。また、画像データ内のオブジェクトを検索することもできます。

Vertex AI を使用すると、画像ベースのモデルからオンライン予測とバッチ予測を行えます。オンライン予測は、モデルのエンドポイントに対して行われる同期リクエストです。アプリケーションの入力に応じてリクエストを行う場合や、タイムリーな推論が必要な場合は、オンライン予測を使用します。バッチ予測は非同期リクエストです。エンドポイントにモデルをデプロイすることなく、モデルリソースからバッチ予測を直接リクエストします。画像データで、すぐにレスポンスを必要とせず 1 回のリクエストで累積データを処理したい場合は、バッチ予測を使用します。

画像の分類

分類モデルは、画像データを分析し、画像に適用されるコンテンツカテゴリのリストを返します。たとえば、猫を含むかどうかで画像を分類するモデルをトレーニングできます。または、犬の品種で犬の画像を分類するようにモデルをトレーニングすることもできます。

画像のオブジェクト検出

オブジェクト検出モデルは、画像データを分析し、画像内で見つかったすべてのオブジェクトに関するアノテーションを返します。このアノテーションは、各オブジェクトのラベルと境界ボックスの位置で構成されています。たとえば、画像データ内で猫がいる場所を見つけるモデルをトレーニングできます。

表形式データ

Vertex AI では、シンプルなプロセスとインターフェースを使用して、表形式データの ML を実行できます。表形式データの問題に対し、次のモデルタイプを作成できます。

バイナリ分類モデルは、バイナリの結果（2 つのクラスのうちのいずれか）を予測します。「はい」か「いいえ」で答える質問には、このモデルタイプを使用します。たとえば、バイナリ分類モデルを構築して利用者がサブスクリプションを購入するかどうかを予測できます。通常、バイナリ分類問題に必要となるデータは、他のモデルタイプよりも少なくなります。
マルチクラス分類モデルは、1 つのクラスを 3 つ以上の個別クラスから予測します。このモデルタイプは分類に使用します。たとえば、小売業者がマルチクラス分類モデルを構築して、買物客をさまざまなペルソナにセグメント分けすることが考えられます。
回帰モデルは、連続値を予測します。たとえば、小売業者が回帰モデルを構築して、買物客が来月使用する金額を予測することが考えられます。
予測モデルは、一連の値を予測します。たとえば、小売店では、商品の在庫を前もって適切に確保できるように、今後 3 か月にわたる商品の日々の需要を予測することが考えられます。

詳細については、表形式データの概要をご覧ください。

表形式データが BigQuery ML に保存されている場合は、AutoML 表形式モデルを BigQuery ML で直接トレーニングできます。詳細については、AutoML 表形式のリファレンスドキュメントをご覧ください。

テキストデータ

2024 年 9 月 15 日以降、分類、エンティティ抽出、感情分析の目標をカスタマイズするには、Vertex AI Gemini のプロンプトとチューニングに移行する必要があります。Vertex AI AutoML Text のモデルを、分類、エンティティ抽出、感情分析の目標に向けてトレーニングまたは更新することはできなくなります。既存の Vertex AI AutoML Text モデルは、2025 年 6 月 15 日まで引き続き使用できます。AutoML Text と Gemini の比較については、AutoML Text ユーザー向けの Gemini をご覧ください。プロンプト機能の向上による Gemini のユーザーエクスペリエンスの改善について詳しくは、チューニングの概要をご覧ください。チューニングを開始するには、Gemini テキストモデルのモデルチューニングをご覧ください。

AutoML は、機械学習を使用してテキストデータの構造と意味を分析します。AutoML を使用すると、テキストデータの分類、情報の抽出、著者の感情を把握する ML モデルをトレーニングできます。

Vertex AI を使用すると、テキストベースのモデルからオンライン予測とバッチ予測を行えます。オンライン予測は、モデルのエンドポイントに対して行われる同期リクエストです。アプリケーションの入力に応じてリクエストを行う場合や、タイムリーな推論が必要な場合は、オンライン予測を使用します。バッチ予測は非同期リクエストです。エンドポイントにモデルをデプロイすることなく、モデルリソースからバッチ予測を直接リクエストします。テキストデータで、すぐにレスポンスを必要とせず 1 回のリクエストで累積データを処理したい場合は、バッチ予測を使用します。

テキストの分類

分類モデルは、テキストデータを分析し、データで見つかったテキストに該当するカテゴリのリストを返します。Vertex AI では、単一ラベルとマルチラベルのテキスト分類モデルの両方が用意されています。

テキストのエンティティ抽出

エンティティ抽出モデルは、データ内で参照されている既知のエンティティについてテキストデータを検査し、テキスト内のエンティティにラベルを付けます。

テキストの感情分析

感情分析モデルは、テキストデータを検査し、その中の優勢的な感情を特定して、特に書き手の肯定的な意見、否定的な意見、中立的な意見を判別します。

動画データ

AutoML は、ML を使用して動画データを分析し、ショットやセグメントの分類を行います。動画データ内の複数のオブジェクトを検出して追跡することもできます。

動画の動作認識

動作認識モデルは、動画データを分析し、動作の発生時点で動作を分類してリストを返します。たとえば、動画データを分析してサッカーのゴール、ゴルフのスウィング、タッチダウン、ハイタッチなどの動作の瞬間を特定するモデルをトレーニングできます。

動画の分類

分類モデルは、動画データを分析し、分類されたショットとセグメントのリストを返します。たとえば、動画データを分析するモデルをトレーニングし、動画が野球、サッカー、バスケットボール、フットボールのどれに該当するかを識別できます。

動画のオブジェクトトラッキング

オブジェクトトラッキング モデルでは、動画データを分析し、これらのオブジェクトが検出されたショットとセグメントのリストを返します。たとえば、サッカーの動画データを分析してボールを識別し、追跡するモデルをトレーニングできます。

カスタムトレーニング

ニーズに対応できる AutoML ソリューションがない場合は、独自のトレーニングアプリケーションを作成し、作成したアプリケーションを使用して Vertex AI でカスタムモデルをトレーニングすることもできます。任意の ML フレームワークを使用して、トレーニングに使用する次のようなコンピューティングリソースを構成できます。

VM のタイプと数。
グラフィックプロセッシングユニット（GPU）。
Tensor Processing Unit（TPU）。
ブートディスクのタイプとサイズ。

Vertex AI でのカスタムトレーニングについて詳しくは、カスタムトレーニングの概要をご覧ください。