Vertex AI RAG Engine의 벡터 데이터베이스 선택

이 페이지에서는 Vertex AI RAG Engine에서 지원되는 벡터 데이터베이스를 소개합니다. 벡터 데이터베이스(벡터 저장소)를 RAG 코퍼스에 연결하는 방법도 확인할 수 있습니다.

벡터 데이터베이스는 RAG 애플리케이션을 위한 검색을 지원하는 데 중요한 역할을 합니다. 벡터 데이터베이스는 시맨틱 의미와 관계를 포착하는 텍스트 또는 기타 데이터의 수학적 표현인 벡터 임베딩을 저장하고 쿼리하는 특수한 방법을 제공합니다. 벡터 임베딩을 사용하면 RAG 시스템이 복잡하거나 미묘한 쿼리를 처리할 때도 방대한 기술 자료에서 가장 관련성 높은 정보를 빠르고 정확하게 찾을 수 있습니다. 벡터 데이터베이스를 임베딩 모델과 결합하면 LLM의 한계를 극복하고 더 정확하고 관련성 높은 포괄적인 응답을 제공하는 데 도움이 됩니다.

지원되는 벡터 데이터베이스

RAG 코퍼스를 만들 때 Vertex AI RAG Engine은 추가 프로비저닝이나 관리가 필요하지 않은 엔터프라이즈용 RagManagedDb를 기본 벡터 데이터베이스로 제공합니다. RagManagedDb는 KNN 및 ANN 검색 옵션을 모두 제공하며 빠른 프로토타입 제작 및 실험을 위해 기본 등급으로 전환할 수 있습니다. RagManagedDb에서 검색 전략을 선택하거나 등급을 업데이트하는 방법을 자세히 알아보려면 RAG와 함께 RagManagedDb 사용을 참조하세요. Vertex AI RAG Engine이 벡터 데이터베이스를 자동으로 생성하고 관리하도록 하려면 RAG 코퍼스 만들기를 참조하세요.

Vertex AI RAG Engine을 사용하면 기본 RagManagedDb 외에도 RAG 코퍼스 내에서 벡터 데이터베이스를 프로비저닝하고 사용할 수 있습니다. 이 경우 벡터 데이터베이스의 수명 주기와 확장성에 대한 책임은 사용자에게 있습니다.

벡터 데이터베이스 옵션 비교

이 표에는 Vertex AI RAG Engine에서 지원되는 벡터 데이터베이스의 선택사항이 나열되어 있으며 RAG 코퍼스 내에서 벡터 데이터베이스를 사용하는 방법을 설명하는 페이지로 연결되는 링크가 제공됩니다.

벡터 데이터베이스	이점	권장	단점	지원되는 거리 측정항목	검색 유형	출시 단계
`RagManagedDb`(기본값)는 매우 높은 일관성과 고가용성을 제공하며 벡터 검색에 사용할 수 있는 지역별로 분산된 확장 가능한 데이터베이스 서비스입니다. 쉽고 간편하고 빠른	설정할 필요 없음. 엔터프라이즈 규모 및 소규모 사용 사례에 적합함. 일관성이 매우 높음. 고가용성. 짧은 지연 시간. 트랜잭션 워크로드에 적합함. CMEK가 사용 설정됨.	대량의 문서 생성. 엔터프라이즈 규모의 RAG 빌드. 빠른 개념 증명 개발. 낮은 프로비저닝 및 유지보수 오버헤드를 제공합니다. 채팅 봇과 함께 사용. RAG 애플리케이션 빌드.	최적의 재현율을 위해 ANN 기능은 데이터가 크게 변경된 후 색인을 다시 빌드해야 합니다.	`cosine`	KNN(기본값) 및 ANN	일반 안정화 버전
벡터 검색은 Vertex AI 내의 벡터 데이터베이스 서비스로, 머신러닝 작업에 최적화되어 있습니다.	다른 Google Cloud 서비스와 통합 확장성과 안정성은 Google Cloud 인프라에서 지원합니다. 사용한 만큼만 지불하는 가격 책정을 사용합니다.	대량의 문서 생성. 엔터프라이즈 규모의 RAG 빌드. 벡터 데이터베이스 인프라 관리. 기존 Google Cloud 고객 또는 여러 개의 Google Cloud 서비스를 사용하려는 사용자	업데이트가 즉시 반영되지는 않습니다. Google Cloud로 공급업체 종속. 사용 사례에 따라 비용이 더 높을 수 있습니다.	`cosine` `dot-product`	ANN	일반 안정화 버전
Vertex AI Feature Store는 머신러닝 특성을 구성, 저장, 제공하기 위한 관리형 서비스입니다.	Vertex AI 및 기타 Google Cloud 서비스와 통합됩니다. 확장성과 안정성은 Google Cloud 인프라에서 지원합니다. 기존 BigQuery 인프라를 활용합니다.	대량의 문서 생성. 엔터프라이즈 규모의 RAG 빌드. 벡터 데이터베이스 인프라 관리. 기존 Google Cloud 고객 또는 여러 개의 Google Cloud 서비스를 사용하려는 고객	수동 동기화를 실행한 후에만 온라인 스토어에서 변경사항을 사용할 수 있습니다. Google Cloud로 공급업체 종속.	`cosine` `dot-product` `L2 squared`	ANN	미리보기
Weaviate는 유연하고 모듈식인 오픈소스 벡터 데이터베이스입니다.	다양한 데이터 유형을 지원하고 기본 제공되는 그래프 기능을 제공합니다. 오픈소스 및 활기찬 커뮤니티를 제공합니다. 매우 유연하고 맞춤설정이 가능합니다. 텍스트, 이미지와 같은 다양한 형식의 다양한 데이터 유형과 모듈을 지원합니다. Google Cloud, AWS, Azure와 같은 클라우드 제공업체 중에서 선택할 수 있습니다.	대량의 문서 생성. 엔터프라이즈 규모의 RAG 빌드. 벡터 데이터베이스 인프라 관리. 기존 Weaviate 고객.	업데이트가 즉시 반영되지는 않습니다. 설정 및 관리가 더 복잡할 수 있습니다. 성능은 구성에 따라 달라질 수 있습니다.	`cosine` `dot-product` `L2 squared` `hamming` `manhattan`	ANN + 하이브리드 검색 지원	미리보기
Pinecone은 고성능 유사성 검색을 위해 설계된 완전 관리형 클라우드 네이티브 벡터 데이터베이스입니다.	빠른 시작 우수한 확장성과 성능 필터링 및 메타데이터 검색과 같은 고급 기능을 사용하여 벡터 검색에 집중할 수 있습니다. Google Cloud, AWS, Azure와 같은 클라우드 제공업체 중에서 선택할 수 있습니다.	대량의 문서 생성. 엔터프라이즈 규모의 RAG 빌드. 벡터 데이터베이스 인프라 관리. 기존 Pinecone 고객.	업데이트가 즉시 반영되지는 않습니다. 다른 옵션보다 비쌀 수 있음 할당량과 한도는 규모와 성능을 제한합니다. 기본 인프라를 제한적으로 제어합니다.	`cosine` `euclidean` `dot-product`	ANN	일반 안정화 버전

다음 단계

RAG 코퍼스를 만들려면 RAG 코퍼스 만들기 예시를 참조하세요.
모든 RAG 코퍼스를 나열하려면 RAG 코퍼스 목록 예시를 참조하세요.