Google Cloud の生成 AI アプリケーションの RAG インフラストラクチャ

Last reviewed 2025-09-22 UTC

次に、 Google Cloudで検索拡張生成(RAG)対応の生成 AI アプリケーションをデプロイするためのリファレンス アーキテクチャのリストを示します。

リファレンス アーキテクチャ 説明
Google Agentspace と Vertex AI を使用した生成 AI 用 RAG インフラストラクチャ Google Agentspace を統合プラットフォームとして使用し、リアルタイムのデータ可用性とコンテキスト検索の強化を必要とするエンタープライズ アプリケーション向けにエンドツーエンドの RAG データフローをオーケストレートするエージェント駆動型アーキテクチャ。
Vertex AI とベクトル検索を使用した生成 AI 用の RAG インフラストラクチャ 大規模なアプリケーション向けに最適化された高パフォーマンスのベクトル検索を提供する、フルマネージドのサーバーレス アーキテクチャ。
Vertex AI と AlloyDB for PostgreSQL を使用した生成 AI 用 RAG インフラストラクチャ ベクトル エンベディングをオペレーショナル データとともに Cloud SQL や AlloyDB for PostgreSQL などのフルマネージド データベースに保存するフルマネージド データベース アーキテクチャ。
GKE と Cloud SQL を使用した生成 AI 用 RAG インフラストラクチャ Ray、Hugging Face、LangChain などのオープンソース ツールを使用してカスタム アプリケーションを構築するための最大限の制御を提供する、柔軟なコンテナベースのアーキテクチャ。
Vertex AI と Spanner Graph を使用した生成 AI 用 GraphRAG インフラストラクチャ ベクトル検索とナレッジグラフ クエリを組み合わせて、相互接続されたコンテキスト データを取り出す高度な RAG アーキテクチャ。これにより、生成 AI のレスポンスがより詳細で関連性の高いものになります。