Vertex AI での予測の取得の概要

予測とは、トレーニング済み機械学習モデルの出力です。このページでは、Vertex AI のモデルから予測を取得するワークフローの概要を説明します。

Vertex AI では、次の 2 つの方法で予測を取得できます。

  • オンライン予測は、モデル endpoint に対して行われる同期リクエストです。リクエストを送信する前に、model リソースを endpoint にデプロイする必要があります。これにより、コンピューティング リソースがモデルに関連付けられ、低レイテンシでオンライン予測を行えるようになります。アプリケーションの入力に応じてリクエストを行う場合や、タイムリーな推論が必要な場合は、オンライン予測を使用します。

  • バッチ予測は非同期リクエストです。モデルをエンドポイントにデプロイすることなく、直接 model リソースから batchPredictionsJob をリクエストします。即時のレスポンスが必要なく、累積されたデータを 1 回のリクエストで処理する場合は、バッチ予測を使用します。

カスタム トレーニング済みモデルからの予測の取得

予測を取得するには、まずモデルをインポートする必要があります。インポートすると、モデルは model リソースとなって、Vertex AI Model Registry に表示されます。

その後、予測を取得する方法については、次のドキュメントをご覧ください。

AutoML モデルから予測を取得する

カスタム トレーニング済みモデルとは異なり、AutoML モデルはトレーニング後に Vertex AI モデル レジストリに自動的にインポートされます。

それ以外は、AutoML モデルのワークフローは似ていますが、データ型とモデルの目標によって多少異なります。AutoML 予測の取得に関するドキュメントは、AutoML のドキュメントの横にあります。ドキュメントへのリンクは次のとおりです。

画像

次のタイプの画像 AutoML モデルから予測を取得する方法を学びます。

表形式

次のタイプの表形式 AutoML モデルから予測を取得する方法を学びます。

テキスト

次のタイプの AutoML モデルから予測を取得する方法を学びます。

動画

次のタイプの動画 AutoML モデルから予測を取得する方法を学びます。