Vertex AI Agent Engine の概要

Vertex AI Platform の一部である Vertex AI Agent Engine は、デベロッパーが本番環境で AI エージェントをデプロイ、管理、スケーリングできるようにする一連のサービスです。本番環境でエージェントをスケーリングするためのインフラストラクチャの処理は Agent Engine が行うため、開発者はアプリケーションの作成に集中できます。Vertex AI Agent Engine は、個別にまたは組み合わせて使用できる次のサービスを提供します。

  • ランタイム:

  • 品質と評価(プレビュー): 統合された Gen AI Evaluation Service でエージェントの品質を評価し、Gemini モデルのトレーニング実行でエージェントを最適化します。

  • Example Store(プレビュー): 少数ショットの例を保存して動的に取得し、エージェントのパフォーマンスを向上させます。

  • セッション(プレビュー): Agent Engine Sessions を使用すると、ユーザーとエージェント間の個々のインタラクションを保存し、会話のコンテキストの明確なソースを提供できます。

  • Memory Bank(プレビュー版): Agent Engine Memory Bank を使用すると、セッションから情報を保存して取得し、エージェントのインタラクションをパーソナライズできます。

  • コード実行(プレビュー): Agent Engine のコード実行を使用すると、エージェントは安全で隔離されたマネージド サンドボックス環境でコードを実行できます。

Vertex AI Agent Engine のコンセプトの概要

Vertex AI Agent Engine は、AI エージェントの検出、構築、デプロイを行うための機能スイートである Vertex AI Agent Builder の一部です。

Vertex AI Agent Engine で作成してデプロイする

注: Vertex AI Agent Engine での効率的な IDE ベースの開発とデプロイ エクスペリエンスについては、agent-starter-pack をご覧ください。すぐに使用できるテンプレートとテスト用の組み込み UI が用意されており、デプロイ、運用、評価、カスタマイズ、オブザーバビリティが簡素化されています。

Vertex AI Agent Engine でエージェントを構築するワークフローは次のとおりです。

手順 説明
1. 環境を設定する Google プロジェクトを設定し、最新バージョンの Vertex AI SDK for Python をインストールします。
2. エージェントを開発する Vertex AI Agent Engine にデプロイできるエージェントを開発します。
3. エージェントをデプロイする エージェントを Vertex AI Agent Engine マネージド ランタイムにデプロイします。
4. エージェントを使用する API リクエストを送信してエージェントをクエリします。
5. デプロイされたエージェントを管理する Vertex AI Agent Engine にデプロイしたエージェントを管理、削除します。

次の図は、このプロセスを示しています。

エージェントを作成してデプロイする 

サポートされているフレームワーク

次の表に、Vertex AI Agent Engine がさまざまなエージェント フレームワークに提供するサポートレベルを示します。

サポートレベル エージェント フレームワーク
カスタム テンプレート: カスタム テンプレートを適応させて、フレームワークから Vertex AI Agent Engine へのデプロイをサポートできます。 CrewAIカスタム フレームワーク
Vertex AI SDK の統合: Vertex AI Agent Engine は、Vertex AI SDK とドキュメントでフレームワークごとにマネージド テンプレートを提供します。 AG2LlamaIndex
完全な統合: フレームワーク、Vertex AI Agent Engine、より広範な Google Cloud エコシステム全体で機能するように統合されています。 Agent Development Kit(ADK)LangChainLangGraph

Agent Starter Pack を使用して本番環境にデプロイする

Agent Starter Pack は、Vertex AI Agent Engine 用に構築された本番環境対応の生成 AI エージェント テンプレートのコレクションです。Agent Starter Pack には次のものが含まれています。

  • 事前構築済みのエージェント テンプレート: ReAct、RAG、マルチエージェントなどのテンプレート。
  • インタラクティブなプレイグラウンド: エージェントをテストして操作します。
  • 自動化されたインフラストラクチャ: Terraform を使用してリソース管理を効率化します。
  • CI/CD パイプライン: Cloud Build を活用した自動デプロイ ワークフロー。
  • オブザーバビリティ: Cloud Trace と Cloud Logging の組み込みサポート。

使用を開始するには、クイックスタートをご覧ください。

ユースケース

エンドツーエンドの例を使用して Vertex AI Agent Engine の詳細を確認するには、次のリソースをご覧ください。

ユースケース 説明 リンク
公開 API に接続してエージェントを構築する 通貨を変換する。

通貨両替アプリに接続する関数を作成して、モデルが「今日のユーロとドルの為替レートは?」などのクエリに正確な回答を提供できるようにします。
Vertex AI SDK for Python ノートブック - Vertex AI Agent Engine を使用したエージェントの構築とデプロイの概要
コミュニティ ソーラー プロジェクトの設計。

設置場所の候補を特定し、関連する政府機関やサプライヤーを調べ、地域や建物の衛星画像と太陽光発電のポテンシャルを確認し、太陽光パネルを設置するのに最適な場所を見つけます。
Vertex AI SDK for Python ノートブック - Vertex AI Agent Engine を使用して Google Maps API エージェントを構築してデプロイする
データベースに接続してエージェントを構築する AlloyDB および Cloud SQL for PostgreSQL とのインテグレーション。 ブログ投稿 - AlloyDB と Cloud SQL for PostgreSQL 向け LangChain on Vertex AI のご紹介

Vertex AI SDK for Python ノートブック - Cloud SQL for PostgreSQL を使用した RAG アプリケーションを Vertex AI Agent Engine にデプロイする

Vertex AI SDK for Python ノートブック - AlloyDB for PostgreSQL を使用した RAG アプリケーションを Vertex AI Agent Engine にデプロイする
データベース内のデータにアクセスするツールを使用してエージェントを構築します。 Vertex AI SDK for Python ノートブック - Vertex AI Agent Engine と MCP Toolbox for Databases を使用してエージェントをデプロイする
自然言語を使用して構造化データストアをクエリして理解する。 Vertex AI SDK for Python ノートブック - Vertex AI Agent Engine と Vertex AI Search の RAG を使用して会話型検索エージェントを構築する
自然言語を使用してグラフ データベースをクエリして理解する ブログ投稿 - LangChain と Neo4j を備えた Vertex AI Agent Engine を使用する GenAI GraphRAG と AI エージェント
自然言語を使用してベクトルストアをクエリして理解する ブログ投稿 - MongoDB Atlas と Vertex AI Agent Engine を使用して GenAI RAG を簡素化する
Agent Development Kit でエージェントを構築する Agent Development Kit を使用してエージェントを構築してデプロイする。 Agent Development Kit - Vertex AI Agent Engine にデプロイする
Vertex AI エクスプレス モードで、Vertex AI Agent Engine のセッションとメモリバンクを使用して、課金なしでコンテキストを管理します。 Agent Development Kit - Vertex AI エクスプレス モードの Vertex AI Agent Engine セッションと Memory Bank。
OSS フレームワークを使用してエージェントを構築する OneTwo オープンソース フレームワークを使用してエージェントを構築してデプロイする。 ブログ投稿 - OneTwo と Vertex AI Agent Engine: Google Cloudでの高度な AI エージェントの開発
LangGraph オープンソース フレームワークを使用してエージェントを構築してデプロイする。 Vertex AI SDK for Python ノートブック - Vertex AI Agent Engine を使用した LangGraph アプリケーションの構築とデプロイ
エージェントのデバッグと最適化 OpenTelemetry と Cloud Trace を使用してエージェントをビルドしてトレースする。 Vertex AI SDK for Python ノートブック - エージェントのデバッグと最適化: Vertex AI Agent Engine でのトレースのガイド
A2A プロトコルを使用してマルチエージェント システムを構築する(プレビュー) フレームワークに関係なく、他のエージェントと通信して連携する相互運用可能なエージェントを構築します。 詳細については、A2A プロトコルのドキュメントをご覧ください。

エンタープライズ セキュリティ

Vertex AI Agent Engine は、企業のセキュリティ要件を満たし、組織のセキュリティ ポリシーを遵守し、セキュリティのベスト プラクティスに従うのに役立つ機能をいくつかサポートしています。次の機能がサポートされています。

  • 顧客管理の暗号鍵(CMEK): Vertex AI Agent Engine は、独自の暗号鍵でデータを保護する CMEK をサポートしています。これにより、 Google Cloudで保存データを保護する鍵の所有権と完全な制御権を取得できます。詳細については、Agent Engine CMEK をご覧ください。

  • VPC Service Controls: Vertex AI Agent Engine は、データ セキュリティを強化し、データの引き出しのリスクを軽減するために VPC Service Controls をサポートしています。VPC Service Controls が構成されている場合、デプロイされたエージェントは、BigQuery API、Cloud SQL Admin API、Vertex AI API などの Google API とサービスへの安全なアクセスを維持し、定義された境界内でのシームレスなオペレーションを確認します。VPC Service Controls は、すべての公共のインターネット アクセスを効果的にブロックし、データ移動を承認済みネットワーク境界内に制限することで、企業のセキュリティ ポスチャーを大幅に強化します。

  • データ所在地(DRZ): Vertex AI Agent Engine は、すべての保存データが指定されたリージョン内に保存されるように、データ所在地(DRZ)をサポートしています。

  • Private Service Connect インターフェース: PSC-I を使用すると、エージェントはユーザーの VPC でプライベートにホストされているサービスとやり取りできます。詳細については、Vertex AI Agent Engine で Private Service Connect インターフェースを使用するをご覧ください。

  • HIPAA: Vertex AI Platform の一部として、Vertex AI Agent Engine は HIPAA ワークロードをサポートしています。

サポートされるリージョン

Vertex AI Agent Engine とエージェント エンジン セッションは、次のリージョンでサポートされています。

地域 場所 サポート対象のバージョン
us-central1 アイオワ v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
us-east4 北バージニア v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
us-west1 オレゴン v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
europe-west1 ベルギー v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
europe-west2 ロンドン v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
europe-west3 フランクフルト v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
europe-west4 オランダ v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
europe-southwest1 マドリッド v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
asia-east1 台湾 v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
asia-northeast1 東京 v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
asia-south1 ムンバイ v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
asia-southeast1 シンガポール v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。
australia-southeast2 メルボルン v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。

Agent Engine Memory Bank(プレビュー)では、次のリージョンがサポートされています。

地域 場所 サポート対象のバージョン
us-central1 アイオワ v1beta1 バージョンがサポートされています。
us-east4 北バージニア v1beta1 バージョンがサポートされています。
us-west1 オレゴン v1beta1 バージョンがサポートされています。
europe-west1 ベルギー v1beta1 バージョンがサポートされています。
europe-west4 オランダ v1beta1 バージョンがサポートされています。
europe-southwest1 マドリッド v1beta1 バージョンがサポートされています。

Agent Engine コード実行(プレビュー版)では、次のリージョンがサポートされています。

地域 場所 サポート対象のバージョン
us-central1 アイオワ v1beta1 バージョンがサポートされています。

割り当て

各リージョンの特定のプロジェクトの Vertex AI Agent Engine には、次の上限が適用されます。
説明 上限
1 分あたりの Vertex AI Agent Engine の作成、削除、更新回数 10
1 分あたりの Vertex AI Agent Engine セッションの作成、削除、更新回数 100
Query または StreamQuery Vertex AI Agent Engine(1 分あたり) 90
1 分あたりの Vertex AI Agent Engine セッションへのイベントの追加 300
Vertex AI Agent Engine リソースの最大数 100
1 分あたりの Vertex AI Agent Engine メモリリソースの作成、削除、更新回数 100
1 分あたりの Vertex AI Agent Engine Memory Bank からの取得、一覧表示、取得回数 300
サンドボックス環境(コード実行)の 1 分あたりの実行リクエスト数 1000
リージョンあたりのサンドボックス環境(コード実行)エンティティ 1000
sendMessagecancelTask などの A2A エージェントの投稿リクエスト数(1 分あたり) 60
1 分あたりの getTaskgetCard などの A2A エージェントの GET リクエスト数 600
BidiStreamQuery API を使用した 1 分あたりの同時ライブ双方向接続数 10

料金

Agent Engine ランタイムの料金は、エージェントがリクエストの処理に使用するコンピューティング(vCPU 時間)とメモリ(GiB 時間)に基づいています。デプロイされたエージェントがアイドル状態になっている時間に対しては課金されません。

プロダクト SKU ID 価格
ReasoningEngine vCPU 8A55-0B95-B7DC $0.0994/vCPU-Hr
ReasoningEngine メモリ 0B45-6103-6EC1 $0.0105/GiB-Hr

詳細は、料金をご覧ください。

クライアント ベースの SDK への移行

Vertex AI SDK for Python 内の agent_engines モジュールは、次の主な理由により、クライアントベースの設計にリファクタリングされています。

  • 標準型表現で Google ADK と Google Gen AI SDK に合わせるため。これにより、さまざまな SDK でデータ型を表す方法の一貫性と標準化が確保され、相互運用性が簡素化され、変換のオーバーヘッドが削減されます。
  • マルチ プロジェクトのマルチ ロケーション アプリケーションで Google Cloud パラメータのクライアント レベルのスコープ設定。これにより、アプリケーションは、特定のプロジェクトとロケーションの設定で各クライアント インスタンスを構成することで、異なる Google Cloud プロジェクトと地理的位置にわたるリソースとのやり取りを管理できます。
  • Vertex AI Agent Engine サービスの検出可能性と一貫性を向上させるため

次のステップ