Vertex AI での予測取得の概要

予測とは、トレーニング済み ML モデルの出力です。このページでは、Vertex AI のモデルから予測を取得するワークフローの概要について説明します。

Vertex AI では、次の 2 つの方法で予測を取得できます。

オンライン予測は、endpoint にデプロイされたモデルに対して行われる同期リクエストです。したがって、リクエストを送信する前に、まず Model リソースをエンドポイントにデプロイする必要があります。これにより、コンピューティングリソースがモデルに関連付けられ、低レイテンシでオンライン予測を行えるようになります。アプリケーションの入力に応じてリクエストを行う場合や、タイムリーな推論が必要な場合は、オンライン予測を使用します。
バッチ予測は、エンドポイントにデプロイされていないモデルに対して行われる非同期リクエストです。リクエストを（BatchPredictionsJob リソースとして）Model リソースに直接送信します。即時のレスポンスが必要なく、累積されたデータを 1 回のリクエストで処理する場合は、バッチ予測を使用します。

カスタムトレーニング済みモデルからの予測を取得する

予測を取得するには、まずモデルをインポートする必要があります。インポートすると、モデルは Model リソースとなって、Vertex AI Model Registry に表示されます。

その後、予測を取得する方法については、次のドキュメントをご覧ください。

カスタムトレーニングモデルとは異なり、AutoML モデルはトレーニング後に Vertex AI Model Registry に自動的にインポートされます。

それ以外は AutoML モデルのワークフローも似ていますが、データ型とモデルの目標によって若干異なります。AutoML 予測の取得に関するドキュメントは、その他の AutoML のドキュメントとともに用意されています。ドキュメントへのリンクは次のとおりです。

次のタイプの画像 AutoML モデルから予測を取得する方法を学習します。

次のタイプの表形式 AutoML モデルから予測を取得する方法を学習します。

次のタイプのテキスト AutoML モデルから予測を取得する方法を学習する。

次のタイプの動画 AutoML モデルから予測を取得する方法を学習します。

BigQuery ML モデルから予測を取得する方法は 2 つあります。

BigQuery ML のモデルから直接バッチ予測をリクエストできます。
モデルを BigQuery ML からエクスポートする、または Model Registry にインポートすることなく、Model Registry に直接登録できます。