Vertex AI の生成 AI モデルに接続する

Vertex AI は、ML モデルと AI アプリケーションのトレーニング、チューニング、デプロイを行える機械学習(ML)プラットフォームです。既存の Cloud Run サービスに生成 AI 機能を追加するには、Vertex AI を使用して Gemini、PaLM、Imagen、Codey などの生成 AI モデルにアクセスします。

このガイドでは、Cloud Run インテグレーションを使用して、Cloud Run サービスから Vertex AI にアクセスできるようにする方法について説明します。

始める前に

  • 統合する Cloud Run サービスがすでにデプロイされていることを確認します。
  • Vertex AI の料金ページを確認します。インテグレーションで使用した個々のリソースに対して課金されます。

必要なロール

Cloud Run インテグレーションを使用するには、ユーザーまたは管理者が 2 つの異なるプリンシパルに IAM のロールを付与する必要があります。

クリックして Google アカウントに必要なロールを表示

Cloud Run の統合を使用するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを Google アカウントに付与するよう管理者に依頼してください。

クリックしてサービス アカウントに必要なロールを表示

Cloud Run サービスをデプロイするには、自動作成された Compute Engine のデフォルトのサービス アカウントを使用するか、ユーザー管理のサービス アカウントを指定します。サービス アカウントには次のロールが必要です。

サービスを Vertex AI に接続する

Cloud Run インテグレーションを使用して Vertex AI に接続すると、次の処理が行われます。

  • Cloud Run サービスで Vertex AI API が有効になり、Vertex AI の生成 AI モデルにアクセスできるようになります。
  • サービス ID に必要なロールが付与されます。

インテグレーションは、コンソールまたはコマンドラインから作成できます。

コンソール

  1. Google Cloud コンソールで [Cloud Run] ページに移動します。

    Cloud Run に移動

  2. この統合で使用するサービスリストでサービスをクリックします。

  3. [統合] タブをクリックします。

  4. [統合を追加] をクリックします。

  5. [Vertex AI] をクリックします。

  6. デフォルト名をそのまま使用するか、任意の名前に変更します。

  7. API のリストを有効にするように求められたら、[有効にする] をクリックし、API が有効になるまで待ちます。

  8. [送信] をクリックし、インテグレーションが完了するまで待ちます。この処理には 1 分ほどかかることがあります。

コマンドライン

  1. 最新の Google Cloud CLI に更新します。

    gcloud components update
    
  2. 統合を作成します。

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \
    

    次のように置き換えます。

    • SERVICE: Cloud Run サービス名。

    必要に応じて、--service-account=SERVICE_ACCOUNT_EMAIL フラグを含めます。

    • SERVICE_ACCOUNT_EMAIL は、サービスのデプロイに使用されるユーザー管理のサービス アカウントのメールアドレス(PROJECT_NUMBER-compute@developer.gserviceaccount.com)に置き換えます。デフォルトのコンピューティング サービス アカウント(SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com)を使用する場合は、このフラグを省略します。

      Cloud Run インテグレーションをデプロイするときに、指定されたサービス アカウントを引き続き使用するには、次のコマンドを実行します。

      gcloud config set runapps/deployment-service-account
      
  3. 1 分ほど待ちます。その間に、Vertex AI API を呼び出す権限が Cloud Run サービスに付与されます。

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.
    

    gcloud beta run integrations describe を使用してステータスを確認できます。

Vertex AI インテグレーションを表示する

Cloud Run サービスと Vertex AI のインテグレーションの現在のステータスを表示するには:

コンソール

  1. Google Cloud コンソールで [Cloud Run] ページに移動します。

    Cloud Run に移動

  2. この統合で使用するサービスリストでサービスをクリックします。

  3. [統合] タブをクリックします。

  4. 目的の Vertex AI インテグレーションを見つけて、[詳細を表示] をクリックします。

コマンドライン

  1. 利用可能なインテグレーションのリストを取得するには、次のコマンドを使用します。

    gcloud beta run integrations list
  2. 返されたリストの名前を使用して、その詳細を表示します。

    gcloud beta run integrations describe INTEGRATION_NAME

    INTEGRATION_NAME は、Vertex AI インテグレーションの名前に置き換えます。

Vertex AI インテグレーションを削除する

インテグレーションを削除すると、インテグレーションに関連付けられているすべての Google Cloud リソースも削除されますが、Cloud Run サービスは削除されません。

Cloud Run サービスから Vertex AI インテグレーションを削除するには:

コンソール

  1. Google Cloud コンソールで [Cloud Run] ページに移動します。

    Cloud Run に移動

  2. 統合を削除するサービスをクリックします。

  3. [統合] タブをクリックします。

  4. 目的の Vertex AI インテグレーションを見つけて、その右側にある省略記号アイコンをクリックし、[削除] をクリックします。

コマンドライン

  1. 利用可能なインテグレーションのリストを取得するには、次のコマンドを使用します。

    gcloud beta run integrations list
  2. 返されたリストの名前を使用して、インテグレーションを削除します。

    gcloud beta run integrations delete INTEGRATION_NAME
    

    次のように置き換えます。

    • INTEGRATION_NAME は、Vertex AI インテグレーションの名前に置き換えます。

    必要に応じて、次のフラグ オプションを使用できます。

    オプション 説明
    --service-account 削除オペレーションを実行するユーザー管理のサービス アカウントのメールアドレス。

コードで Vertex AI の生成 AI モデルにアクセスする

インテグレーションが完了したら、Vertex AI モデルの API にリクエストを送信し、Vertex AI Studio ですぐにテストしたり、アプリケーションで生成 AI モデルをカスタマイズできます。

制限事項

Cloud Run インテグレーションは、特定のリージョンでのみサポートされています。Cloud Run インテグレーションでサポートされていないリージョンを使用する必要がある場合は、Vertex AI のロケーションをご覧ください。