Cloud Run を使用して AI エージェントをホストします。AI エージェントは Cloud Run サービスとして実装でき、タスクを実行し、会話形式でユーザーに情報を提供できます。Cloud Run は、リソースをプロビジョニングすることなく自動スケーリングと高いスケーラビリティを提供し、実際の使用量に対してのみ課金されます。AI エージェントは、カスタマー サービス、バーチャル アシスタント、コンテンツ生成など、さまざまな目的に使用できます。
Cloud Run サービスをスケーラブルな API エンドポイントとして使用して、エンドユーザーからのプロンプトを処理できます。サービスが、LangChain、LangGraph、Firebase Genkit などの AI オーケストレーション フレームワークを実行し、次の呼び出しをオーケストレートします。
- Gemini API、Vertex AI エンドポイント、または別の GPU 対応の Cloud Run サービスなどの AI モデル。
pgvector
拡張機能を使用する Cloud SQL for PostgreSQL や AlloyDB for PostgreSQL などのベクトル データベース。- 他のサービスまたは API。
アーキテクチャの詳細については、Vertex AI と AlloyDB for PostgreSQL を使用した RAG 対応生成 AI アプリケーション用インフラストラクチャをご覧ください。
Firebase Genkit を Cloud Run にデプロイする方法については、Firebase Genkit のドキュメントをご覧ください。
codelab で、LangChain アプリを構築して Cloud Run にデプロイする方法を学びます。