AutoML ユーザー用の Vertex AI

このページでは、従来の AutoML プロダクトと Vertex AI の AutoML を比較し、Vertex AI の使用方法を以前の AutoML ユーザー向けに説明します。

ユースケースに該当する表で、ワークフローに影響を与える可能性のある変更を確認してください。

一般的な使用方法

この違いは、すべての Vertex AI ユーザーに適用されます。

オペレーション レガシー AutoML Vertex AI
モデルのデプロイ オンライン予測で使用可能にするために、モデルを直接デプロイする。 オンライン予測で使用するリソースを提供するためのエンドポイント オブジェクトを作成する。作成したエンドポイントに、モデルをデプロイする。予測をリクエストするには、predict() メソッドを呼び出します。
プロジェクト番号またはプロジェクト ID の使用 AutoML のドキュメントに project-number の使用例と project-id の使用例があります。 project-numberproject-id はどちらも Vertex AI で動作します。

AutoML Natural Language のユーザー

AutoML Natural Language は、Vertex AI でテキストデータ型を使用します。

オペレーション AutoML Natural Language Vertex AI
トレーニング データ形式 CSV ファイルを使用して、インライン テキスト スニペットの追加やドキュメントの参照を行うことができます。エンティティ抽出の場合、CSV または JSON Lines ファイルを使用してドキュメントを参照できます(インライン テキストはサポートされていません)。 テキスト エンティティ抽出を除いて、CSV または JSON Lines ファイルを使用すると、インライン テキスト スニペットや TXT 型のドキュメントを参照できます。エンティティ抽出は JSON Lines ファイルのみをサポートします。
データセットのインポート CSV ファイルを使用して ML ファイル(TRAIN、TEST、VALIDATION 用)のデータを分割する方法を指定します。 ML の使用値は、CSV のオプション列(データと同じ行)で指定するか、データと同じ JSON オブジェクトにある JSON Lines 内のタグとして指定します。ML の使用値を指定しない場合、データはトレーニング、テスト、検証用に自動的に分割されます。
感情分析の場合、CSV ファイルで各行の最後の列に感情の最大値を含める必要があります。
データセット アノテーション アノテーションはインポート時にデータセットに追加されます。また、Google Cloud コンソールで追加することもできます。別の目的で他のデータセットのデータを使用する場合は、別のアノテーションを使用して新しいデータセットを作成する必要があります。 アノテーションは、AnnotationSet オブジェクトとしてグループ化されます。同じデータセットで複数のアノテーション セットを使用できます。
ストレージの費用 内部ストレージに読み込まれたデータセットには課金されません。 データセットを作成すると、プロジェクトの Cloud Storage にデータが読み込まれます。このストレージに対して料金が発生します。詳細
データラベル付け ラベル付け手順を内部ストレージに読み込み、タスク作成リクエストに追加します。アノテーションはスタンドアロン オブジェクトです。 URL を使用してラベル付けの手順を指定します。アノテーションは Dataset オブジェクトの一部であり、API を使用して操作することはできません。

AutoML Vision と AutoML Video Intelligence のユーザー

Vertex AI では、AutoML Vision と AutoML Video はそれぞれ画像と動画データ型を使用しています。

オペレーション AutoML Vision と AutoML Video Vertex AI
データ入力フォーマット JSON Lines 形式はサポートされていません。 JSON Lines 形式はデータソースでサポートされています。
データのインポート(動画のみ) 動画に対する ML の使用(トレーニング、テスト)を指定するには、2 レベルの CSV ファイルを使用します。 ML の使用値は、CSV のオプション列(データと同じ行)で指定するか、データと同じ JSON オブジェクトにある JSON Lines 内のタグとして指定します。ML の使用値を指定しない場合、データはトレーニング、テスト、検証用に自動的に分割されます。
データセット アノテーション アノテーションはインポート時にデータセットに追加されます。また、Google Cloud コンソールで追加することもできます。別の目的で他のデータセットのデータを使用する場合は、別のアノテーションを使用して新しいデータセットを作成する必要があります。 アノテーションは、AnnotationSet オブジェクトとしてグループ化されます。同じデータセットで複数のアノテーション セットを使用できます。
ストレージの費用 内部ストレージに読み込まれたデータセットには課金されません。 データセットを作成すると、プロジェクトの Cloud Storage にデータが読み込まれます。このストレージに対して料金が発生します。詳細
データラベル付け ラベル付け手順を内部ストレージに読み込み、タスク作成リクエストに追加します。アノテーションはスタンドアロン オブジェクトです。 URL を使用してラベル付けの手順を指定します。アノテーションは Dataset オブジェクトの一部であり、API を使用して操作することはできません。

AutoML Tables のユーザー

AutoML Tables は、Vertex AI の表形式データ型を使用します。

オペレーション AutoML Tables Vertex AI
データセットの作成 データは内部ストレージにインポートされます。インポート後にデータソースを更新しても、AutoML データセットには影響しません。 データソースは、インポートではなく参照されます。データソースからトレーニングされたモデルが再トレーニングされると、データソースに対する更新が反映されます。
スキーマの確認 データセットにデータをインポートすると、データに関する統計情報が自動的に生成されます。 データセットの統計情報の生成は手動で開始する必要があります。
スキーマの確認 データセットを作成するときに、そのスキーマを確認し、各特徴セットが正しく設定されていることを確認します。明示的に変更しない限り、そのデータセットからトレーニングされるモデルは、このスキーマ設計を使用します。 データセットからモデルをトレーニングすると、Vertex AI は各特徴のデフォルト変換を作成します。この変換は、データと目標に合わない場合にオーバーライドできます。無効なデータが原因で、タイムスタンプと数値のデータ型への変換は失敗する可能性があります。行全体を無効にするか、その列のみを無効にするかを選択できます。
エクスポートしたモデルからの予測の提供 エクスポートされた回帰モデルからの予測では、予測間隔は返されません。 予測間隔は、エクスポートされた回帰モデルからの予測に対して返されます。
特徴量の重要度 Vertex Explainable AI は、AutoML Tables の AI Explanations と同様の機能を提供します。モデルでは、グローバルな特徴量の重要度を使用できます。また、モデルの予測に特徴量の重要度(特徴アトリビューション)を使用することもできます。

API のユーザー

API の詳細については、Vertex AI API リファレンス ドキュメントをご覧ください。

オペレーションまたはエンティティ レガシー AutoML Vertex AI
モデルの作成 モデルを作成するには、model.create() メソッドを使用します。このメソッドは長時間実行オペレーションを返します。 トレーニング ジョブを返す TrainingPipeline オブジェクトを作成します。
クライアント ライブラリの使用 API 用に 1 つの API クライアントがあります。 API リソースごとに異なる API クライアントがあります。
予測のリクエスト 予測をリクエストするには、モデルで predict() メソッドを呼び出します。 予測をリクエストするには、エンドポイント リソースの predict() メソッドを呼び出します。
オンライン予測エンドポイント automl.googleapis.com と一部のプロダクトも eu-automl.googleapis.com をサポートしています。 次のコマンドで、REGION は予測モデルのあるリージョンに置き換えます。
REGION-aiplatform.googleapis.com例:
us-central1-aiplatform.googleapis.com
スキーマと定義ファイル リクエストとレスポンスへのすべての入力は、API サービスによって定義されます。データ形式は事前定義されています。 一部のリクエストとレスポンスのフィールドは、スキーマ ファイルと定義ファイルで定義されています。データ形式は、事前定義されたスキーマ ファイルを使用して定義します。これにより、API とデータ形式が柔軟になります。
ホスト名 automl.googleapis.com aiplatform.googleapis.com
リージョン ホスト名 すべてのプロダクトで必須ではありません。例:
eu-automl.googleapis.com
必須。例:
us-central1-aiplatform.googleapis.com

次のステップ