Application Integration でサポートされているコネクタをご覧ください。

Vertex AI - 予測タスク

Vertex AI - 予測タスクを使用すると、オンライン予測を実行できます。オンライン予測は、モデルのエンドポイントに対して行われる同期リクエストです。オンライン予測は、アプリケーションの入力に応じてリクエストを送信する場合や、タイムリーな推論が必要な場合に使用できます。

Vertex AI は、ML モデルと AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する大規模な言語モデル(LLM)をカスタマイズすることができる Google Cloud サービスです。

準備

Vertex AI - 予測タスクを構成する前に、Google Cloud プロジェクトで次のタスクを行う必要があります。

  1. Vertex AI API を有効にする(aiplatform.googleapis.com)。

    Vertex AI API を有効にする

  2. モデルリソースをエンドポイントにデプロイします。
  3. 認証プロファイルを作成します。Application Integration では、認証プロファイルを使用して、Vertex AI - 予測タスクの認証エンドポイントに接続します。
  4. Google Cloud プロジェクトの Application Integration で VPC Service Controls が設定されていないことを確認します。

Vertex AI - 予測タスクを構成する

  1. Google Cloud コンソールで [Application Integration] ページに移動します。

    Application Integration に移動

  2. ナビゲーション メニューで [統合] をクリックします。

    [統合] ページが開き、Google Cloud プロジェクトで使用可能なすべての統合が一覧表示されます。

  3. 既存の統合を選択するか、[統合の作成] をクリックして新しい統合を作成します。

    新しい統合を作成する場合:

    1. [統合の作成] ペインで名前と説明を入力します。
    2. 統合のリージョンを選択します。
    3. 統合用のサービス アカウントを選択します。統合のサービス アカウントの詳細は、統合ツールバーの [統合の概要] ペインでいつでも変更または更新できます。
    4. [作成] をクリックします。

    統合エディタで統合が開きます。

  4. 統合エディタのナビゲーション バーで、[タスク] をクリックして、使用可能なタスクとコネクタのリストを表示します。
  5. 統合デザイナーで、Vertex AI - 予測の要素をクリックして配置します。
  6. デザイナーで [Vertex AI - Predict] 要素をクリックして、[Vertex AI - Predict] タスク構成ペインを表示します。
  7. [認証] に移動し、使用する既存の認証プロファイルを選択します。

    省略可。タスクを構成する前に認証プロファイルを作成していない場合は、[+ 新しい認証プロファイル] をクリックし、新しい認証プロファイルを作成するに記載されている手順に沿って操作します。

  8. [Task Input] に移動し、次の [タスク入力パラメータ] テーブルを使用して表示される入力フィールドを構成します。

    入力フィールドの変更は自動的に保存されます。

タスクの入力パラメータ

次の表は、Vertex AI - 予測タスクの入力パラメータを示したものです。

プロパティ データ型 説明
リージョン 文字列 モデル エンドポイントのロケーション。例: us - 米国。
ProjectsId 文字列 Google Cloud プロジェクト ID。
エンドポイント文字列 予測の提供をリクエストしたエンドポイントの名前。
リクエスト JSON リクエスト JSON 構造をご覧ください。

タスク出力

Vertex AI - 予測タスクは、予測を含むレスポンスを返します。

エラー処理方式

タスクのエラー処理方法では、一時的なエラーによってタスクが失敗した場合のアクションを指定します。エラー処理方式と、さまざまな種類のエラー処理方式の詳細については、エラー処理方法をご覧ください。

割り当てと上限

割り当てと上限については、割り当てと上限をご覧ください。

次のステップ