Vertex AI の生成 AI モデルに接続する

Vertex AI は、ML モデルと AI アプリケーションのトレーニング、チューニング、デプロイを行える機械学習(ML)プラットフォームです。既存の Cloud Run サービスに生成 AI 機能を追加するには、Vertex AI を使用して Gemini、PaLM、Imagen、Codey などの生成 AI モデルにアクセスします。

このガイドでは、Cloud Run インテグレーションを使用して、Cloud Run サービスから Vertex AI にアクセスできるようにする方法について説明します。

始める前に

  • 統合する Cloud Run サービスがすでにデプロイされていることを確認します。
  • Vertex AI の料金ページを確認します。インテグレーションで使用した個々のリソースに対して課金されます。

必要なロール

Cloud Run インテグレーションを使用するには、ユーザーまたは管理者が 2 つの異なるプリンシパルに IAM のロールを付与する必要があります。

Cloud Run の統合を使用するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを Google アカウントに付与するよう管理者に依頼してください。

Cloud Run サービスをデプロイするには、自動作成された Compute Engine のデフォルトのサービス アカウントを使用するか、ユーザー管理のサービス アカウントを指定します。サービス アカウントには次のロールが必要です。

サービスを Vertex AI に接続する

Cloud Run インテグレーションを使用して Vertex AI に接続すると、次の処理が行われます。

  • Cloud Run サービスで Vertex AI API が有効になり、Vertex AI の生成 AI モデルにアクセスできるようになります。
  • サービス ID に必要なロールが付与されます。

インテグレーションは、コンソールまたはコマンドラインから作成できます。

コンソールgcloud

  1. Google Cloud コンソールで [Cloud Run] ページに移動します。

    Cloud Run に移動

  2. この統合で使用するサービスリストでサービスをクリックします。

  3. [統合] タブをクリックします。

  4. [統合を追加] をクリックします。

  5. [Vertex AI] をクリックします。

  6. デフォルト名をそのまま使用するか、任意の名前に変更します。

  7. API のリストを有効にするように求められたら、[有効にする] をクリックし、API が有効になるまで待ちます。

  8. [送信] をクリックし、インテグレーションが完了するまで待ちます。この処理には 1 分ほどかかることがあります。

  1. 最新の Google Cloud CLI に更新します。

    gcloud components update
  2. 統合を作成します。

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \

    次のように置き換えます。

    • SERVICE: Cloud Run サービス名。

    必要に応じて、--service-account=SERVICE_ACCOUNT_EMAIL フラグを含めます。

    • SERVICE_ACCOUNT_EMAIL は、サービスのデプロイに使用されるユーザー管理のサービス アカウントのメールアドレス(PROJECT_NUMBER-compute@developer.gserviceaccount.com)に置き換えます。デフォルトのコンピューティング サービス アカウント(SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com)を使用する場合は、このフラグを省略します。

      Cloud Run インテグレーションをデプロイするときに、指定されたサービス アカウントを引き続き使用するには、次のコマンドを実行します。

      gcloud config set runapps/deployment-service-account
  3. 1 分ほど待ちます。その間に、Vertex AI API を呼び出す権限が Cloud Run サービスに付与されます。

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.

    gcloud beta run integrations describe を使用してステータスを確認できます。

Vertex AI インテグレーションを表示する

Cloud Run サービスと Vertex AI のインテグレーションの現在のステータスを表示するには:

コンソールgcloud
  1. Google Cloud コンソールで [Cloud Run] ページに移動します。

    Cloud Run に移動

  2. この統合で使用するサービスリストでサービスをクリックします。

  3. [統合] タブをクリックします。

  4. 目的の Vertex AI インテグレーションを見つけて、[詳細を表示] をクリックします。

  1. 利用可能なインテグレーションのリストを取得するには、次のコマンドを使用します。

    gcloud beta run integrations list
  2. 返されたリストの名前を使用して、その詳細を表示します。

    gcloud beta run integrations describe INTEGRATION_NAME

    INTEGRATION_NAME は、Vertex AI インテグレーションの名前に置き換えます。

Vertex AI インテグレーションを削除する

インテグレーションを削除すると、インテグレーションに関連付けられているすべての Google Cloud リソースも削除されますが、Cloud Run サービスは削除されません。

Cloud Run サービスから Vertex AI インテグレーションを削除するには:

コンソールgcloud
  1. Google Cloud コンソールで [Cloud Run] ページに移動します。

    Cloud Run に移動

  2. 統合を削除するサービスをクリックします。

  3. [統合] タブをクリックします。

  4. 目的の Vertex AI インテグレーションを見つけて、その右側にある省略記号アイコンをクリックし、[削除] をクリックします。

  1. 利用可能なインテグレーションのリストを取得するには、次のコマンドを使用します。

    gcloud beta run integrations list
  2. 返されたリストの名前を使用して、インテグレーションを削除します。

    gcloud beta run integrations delete INTEGRATION_NAME

    次のように置き換えます。

    • INTEGRATION_NAME は、Vertex AI インテグレーションの名前に置き換えます。

    必要に応じて、次のフラグ オプションを使用できます。

    オプション 説明
    --service-account 削除オペレーションを実行するユーザー管理のサービス アカウントのメールアドレス。

コードで Vertex AI の生成 AI モデルにアクセスする

インテグレーションが完了したら、Vertex AI モデルの API にリクエストを送信し、Vertex AI Studio ですぐにテストしたり、アプリケーションで生成 AI モデルをカスタマイズできます。

制限事項

Cloud Run インテグレーションは、特定のリージョンでのみサポートされています。Cloud Run インテグレーションでサポートされていないリージョンを使用する必要がある場合は、Vertex AI のロケーションをご覧ください。