Vertex AI Platform の一部である Vertex AI Agent Engine は、デベロッパーが本番環境で AI エージェントをデプロイ、管理、スケーリングできるようにする一連のサービスです。本番環境でエージェントをスケーリングするためのインフラストラクチャ管理は Agent Engine が処理します。そのため、開発者はアプリケーションの作成に集中できます。Vertex AI Agent Engine は、個別にまたは組み合わせて使用できる次のサービスを提供します。
ランタイム:
- マネージド ランタイムとエンドツーエンドの管理機能を使用して、エージェントをデプロイしてスケーリングします。
- システム依存関係のビルド時のインストール スクリプトを使用して、エージェントのコンテナ イメージをカスタマイズします。
- VPC-SC コンプライアンス、認証と IAM の構成などのセキュリティ機能を使用します。
- 関数呼び出しなどのモデルとツールにアクセスします。
- さまざまな Python フレームワークを使用して構築されたエージェントをデプロイします。
- Google Cloud Trace(OpenTelemetry をサポート)、Cloud Monitoring、Cloud Logging を使用して、エージェントの動作を把握します。
品質と評価(プレビュー): 統合された Gen AI Evaluation Service でエージェントの品質を評価し、Gemini モデルのトレーニング実行でエージェントを最適化します。
Example Store(プレビュー): 少数ショットの例を保存して動的に取得し、エージェントのパフォーマンスを向上させます。
セッション(プレビュー): Agent Engine Sessions を使用すると、ユーザーとエージェント間の個々のインタラクションを保存し、会話のコンテキストの明確なソースを提供できます。
Memory Bank(プレビュー版): Agent Engine Memory Bank を使用すると、セッションから情報を保存して取得し、エージェントのインタラクションをパーソナライズできます。
Vertex AI Agent Engine は、AI エージェントの検出、構築、デプロイを行うための機能スイートである Vertex AI Agent Builder の一部です。
Vertex AI Agent Engine で作成してデプロイする
注: Vertex AI Agent Engine での効率的な IDE ベースの開発とデプロイ エクスペリエンスについては、agent-starter-pack をご覧ください。すぐに使用できるテンプレートとテスト用の組み込み UI が用意されており、デプロイ、運用、評価、カスタマイズ、オブザーバビリティが簡素化されています。
Vertex AI Agent Engine でエージェントを構築するワークフローは次のとおりです。
手順 | 説明 |
---|---|
1. 環境を設定する | Google プロジェクトを設定し、最新バージョンの Vertex AI SDK for Python をインストールします。 |
2. エージェントを開発する | Vertex AI Agent Engine にデプロイできるエージェントを開発します。 |
3. エージェントをデプロイする | エージェントを Vertex AI Agent Engine マネージド ランタイムにデプロイします。 |
4. エージェントを使用する | API リクエストを送信してエージェントをクエリします。 |
5. デプロイされたエージェントを管理する | Vertex AI Agent Engine にデプロイしたエージェントを管理、削除します。 |
次の図は、このプロセスを示しています。
サポートされているフレームワーク
次の表に、Vertex AI Agent Engine がさまざまなエージェント フレームワークに提供するサポートレベルを示します。
サポートレベル | エージェント フレームワーク |
---|---|
カスタム テンプレート: カスタム テンプレートを適応させて、フレームワークから Vertex AI Agent Engine へのデプロイをサポートできます。 | CrewAI、カスタム フレームワーク |
Vertex AI SDK の統合: Vertex AI Agent Engine は、Vertex AI SDK とドキュメントでフレームワークごとにマネージド テンプレートを提供します。 | AG2、LlamaIndex |
完全な統合: フレームワーク、Vertex AI Agent Engine、より広範な Google Cloud エコシステム全体で機能するように統合されています。 | Agent Development Kit(ADK)、LangChain、LangGraph |
Agent Starter Pack を使用して本番環境にデプロイする
Agent Starter Pack は、Vertex AI Agent Engine 用に構築された本番環境対応の生成 AI エージェント テンプレートのコレクションです。Agent Starter Pack には次のものが含まれています。
- 事前構築済みのエージェント テンプレート: ReAct、RAG、マルチエージェントなどのテンプレート。
- インタラクティブなプレイグラウンド: エージェントをテストして操作します。
- 自動化されたインフラストラクチャ: Terraform を使用してリソース管理を効率化します。
- CI/CD パイプライン: Cloud Build を活用した自動デプロイ ワークフロー。
- オブザーバビリティ: Cloud Trace と Cloud Logging の組み込みサポート。
使用を開始するには、クイックスタートをご覧ください。
ユースケース
エンドツーエンドの例を使用して Vertex AI Agent Engine の詳細を確認するには、次のリソースをご覧ください。
エンタープライズ セキュリティ
Vertex AI Agent Engine は、企業のセキュリティ要件を満たし、組織のセキュリティ ポリシーを遵守し、セキュリティのベスト プラクティスに従うのに役立つ機能をいくつかサポートしています。次の機能がサポートされています。
顧客管理の暗号鍵(CMEK): Vertex AI Agent Engine は CMEK をサポートしており、独自の暗号鍵でデータを保護できます。これにより、 Google Cloudで保存データを保護する鍵の所有権と完全な制御権を取得できます。詳細については、Agent Engine CMEK をご覧ください。
VPC Service Controls: Vertex AI Agent Engine は、データ セキュリティを強化し、データの引き出しのリスクを軽減するために VPC Service Controls をサポートしています。VPC Service Controls が構成されている場合、デプロイされたエージェントは、BigQuery API、Cloud SQL Admin API、Vertex AI API などの Google API とサービスへの安全なアクセスを維持し、定義された境界内でのシームレスなオペレーションを検証します。VPC Service Controls は、すべての公共のインターネット アクセスを効果的にブロックし、データ移動を承認済みネットワーク境界内に制限することで、企業のセキュリティ ポスチャーを大幅に強化します。
Private Service Connect インターフェース: PSC-I を使用すると、エージェントはユーザーの VPC でプライベートにホストされているサービスとやり取りできます。詳細については、VPC Service Controls インターフェースを構成するをご覧ください。
HIPAA: Vertex AI Platform の一部として、Vertex AI Agent Engine は HIPAA ワークロードをサポートしています。
サポートされるリージョン
Vertex AI Agent Engine は、次のリージョンでサポートされています。
地域 | 場所 | サポート対象のバージョン |
---|---|---|
us-central1 |
アイオワ | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
us-east4 |
北バージニア | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
us-west1 |
オレゴン | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
europe-west1 |
ベルギー | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
europe-west2 |
ロンドン | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
europe-west3 |
フランクフルト | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
europe-west4 |
オランダ | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
europe-southwest1 |
マドリッド | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
asia-east1 |
台湾 | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
asia-northeast1 |
東京 | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
asia-south1 |
ムンバイ | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
asia-southeast1 |
シンガポール | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
australia-southeast2 |
メルボルン | v1 は一般提供機能でサポートされています。v1beta1 はプレビュー機能でサポートされています。 |
Agent Engine Memory Bank(プレビュー)では、次のリージョンがサポートされています。
地域 | 場所 | サポート対象のバージョン |
---|---|---|
us-central1 |
アイオワ | v1beta1 バージョンがサポートされています。 |
us-east4 |
北バージニア | v1beta1 バージョンがサポートされています。 |
us-west1 |
オレゴン | v1beta1 バージョンがサポートされています。 |
europe-west1 |
ベルギー | v1beta1 バージョンがサポートされています。 |
europe-west4 |
オランダ | v1beta1 バージョンがサポートされています。 |
europe-southwest1 |
マドリッド | v1beta1 バージョンがサポートされています。 |
割り当て
各リージョンの特定のプロジェクトの Vertex AI Agent Engine には、次の上限が適用されます。説明 | 上限 |
---|---|
1 分あたりの Vertex AI Agent Engine の作成、削除、更新回数 | 10 |
1 分あたりの Vertex AI Agent Engine セッションの作成、削除、更新回数 | 100 |
Query または StreamQuery Vertex AI Agent Engine(1 分あたり) |
90 |
1 分あたりの Vertex AI Agent Engine セッションへのイベントの追加 | 300 |
Vertex AI Agent Engine リソースの最大数 | 100 |
1 分あたりの Vertex AI Agent Engine メモリリソースの作成、削除、更新回数 | 100 |
1 分あたりの Vertex AI Agent Engine Memory Bank からの取得、一覧表示、取得回数 | 300 |
料金
Agent Engine ランタイムの料金は、エージェントがリクエストの処理に使用するコンピューティング(vCPU 時間)とメモリ(GiB 時間)に基づいています。デプロイされたエージェントがアイドル状態になっている時間に対しては課金されません。
プロダクト | SKU ID | 価格 |
---|---|---|
ReasoningEngine vCPU | 8A55-0B95-B7DC | $0.0994/vCPU-Hr |
ReasoningEngine メモリ | 0B45-6103-6EC1 | $0.0105/GiB-Hr |
詳細は、料金をご覧ください。