Google Cloud의 생성형 AI 애플리케이션을 위한 RAG 인프라

Last reviewed 2025-09-22 UTC

다음은 Google Cloud에서 검색 증강 생성 (RAG)으로 생성형 AI 애플리케이션을 배포하기 위한 참조 아키텍처 목록입니다.

참조 아키텍처 설명
Google Agentspace 및 Vertex AI를 사용하는 생성형 AI를 위한 RAG 인프라 Google Agentspace를 실시간 데이터 가용성과 풍부한 컨텍스트 검색이 필요한 엔터프라이즈 애플리케이션을 위한 엔드 투 엔드 RAG 데이터 흐름을 오케스트레이션하는 통합 플랫폼으로 사용하는 에이전트 기반 아키텍처
Vertex AI 및 벡터 검색을 사용하는 생성형 AI를 위한 RAG 인프라 대규모 애플리케이션을 위해 최적화된 고성능 벡터 검색을 제공하는 완전 관리형 서버리스 아키텍처입니다.
Vertex AI 및 PostgreSQL용 AlloyDB를 사용하는 생성형 AI를 위한 RAG 인프라 Cloud SQL 또는 PostgreSQL용 AlloyDB와 같은 완전 관리형 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장하는 완전 관리형 데이터베이스 아키텍처입니다.
GKE 및 Cloud SQL을 사용하는 생성형 AI를 위한 RAG 인프라 Ray, Hugging Face, LangChain과 같은 오픈소스 도구로 맞춤 애플리케이션을 빌드할 수 있는 최대한의 제어 기능을 제공하는 유연한 컨테이너 기반 아키텍처입니다.
Vertex AI 및 Spanner Graph를 사용하는 생성형 AI용 GraphRAG 인프라 벡터 검색과 지식 그래프 쿼리를 결합하여 상호 연결된 맥락 데이터를 검색하는 고급 RAG 아키텍처로, 더 자세하고 관련성 높은 생성형 AI 응답을 생성합니다.