이 페이지에서는 Vertex AI RAG Engine에서 지원되는 벡터 데이터베이스를 소개합니다.
벡터 데이터베이스(벡터 저장소)를 RAG 코퍼스에 연결하는 방법도 확인할 수 있습니다.
벡터 데이터베이스는 RAG 애플리케이션을 위한 검색을 지원하는 데 중요한 역할을 합니다.
벡터 데이터베이스는 시맨틱 의미와 관계를 포착하는 텍스트 또는 기타 데이터의 수학적 표현인 벡터 임베딩을 저장하고 쿼리하는 특수한 방법을 제공합니다. 벡터 임베딩을 사용하면 RAG 시스템이 복잡하거나 미묘한 쿼리를 처리할 때도 방대한 기술 자료에서 가장 관련성 높은 정보를 빠르고 정확하게 찾을 수 있습니다. 벡터 데이터베이스를 임베딩 모델과 결합하면 LLM의 한계를 극복하고 더 정확하고 관련성 높은 포괄적인 응답을 제공하는 데 도움이 됩니다.
지원되는 벡터 데이터베이스
RAG 코퍼스를 만들 때 Vertex AI RAG Engine은 추가 프로비저닝이나 관리가 필요하지 않은 엔터프라이즈용 RagManagedDb를 기본 벡터 데이터베이스로 제공합니다.
RagManagedDb는 KNN 및 ANN 검색 옵션을 모두 제공하며 빠른 프로토타입 제작 및 실험을 위해 기본 등급으로 전환할 수 있습니다.
RagManagedDb에서 검색 전략을 선택하거나 등급을 업데이트하는 방법을 자세히 알아보려면 RAG와 함께 RagManagedDb 사용을 참조하세요. Vertex AI RAG Engine이 벡터 데이터베이스를 자동으로 생성하고 관리하도록 하려면 RAG 코퍼스 만들기를 참조하세요.
Vertex AI RAG Engine을 사용하면 기본 RagManagedDb 외에도 RAG 코퍼스 내에서 벡터 데이터베이스를 프로비저닝하고 사용할 수 있습니다. 이 경우 벡터 데이터베이스의 수명 주기와 확장성에 대한 책임은 사용자에게 있습니다.
벡터 데이터베이스 옵션 비교
이 표에는 Vertex AI RAG Engine에서 지원되는 벡터 데이터베이스의 선택사항이 나열되어 있으며 RAG 코퍼스 내에서 벡터 데이터베이스를 사용하는 방법을 설명하는 페이지로 연결되는 링크가 제공됩니다.
벡터 데이터베이스
이점
권장
단점
지원되는 거리 측정항목
검색 유형
출시 단계
RagManagedDb(기본값)는 매우 높은 일관성과 고가용성을 제공하며 벡터 검색에 사용할 수 있는 지역별로 분산된 확장 가능한 데이터베이스 서비스입니다.
쉽고 간편하고 빠른
설정할 필요 없음.
엔터프라이즈 규모 및 소규모 사용 사례에 적합함.
일관성이 매우 높음.
고가용성.
짧은 지연 시간.
트랜잭션 워크로드에 적합함.
CMEK가 사용 설정됨.
대량의 문서 생성.
엔터프라이즈 규모의 RAG 빌드.
빠른 개념 증명 개발.
낮은 프로비저닝 및 유지보수 오버헤드를 제공합니다.
채팅 봇과 함께 사용.
RAG 애플리케이션 빌드.
최적의 재현율을 위해 ANN 기능은 데이터가 크게 변경된 후 색인을 다시 빌드해야 합니다.
cosine
KNN(기본값) 및 ANN
프리뷰
벡터 검색은 머신러닝 작업에 최적화된 Vertex AI 내의 벡터 데이터베이스 서비스입니다.
다른 Google Cloud 서비스와 통합
확장성과 안정성은 Google Cloud 인프라에서 지원합니다.
사용한 만큼만 지불하는 가격 책정을 사용합니다.
대량의 문서 생성.
엔터프라이즈 규모의 RAG 빌드.
벡터 데이터베이스 인프라 관리.
기존 Google Cloud 고객 또는 여러 개의 Google Cloud 서비스를 사용하려는 사용자
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-08-25(UTC)"],[],[],null,["# Vector database choices in Vertex AI RAG Engine\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces the vector databases supported on Vertex AI RAG Engine.\nYou can also see how to connect a vector database (vector store) to your RAG\ncorpus.\n\nVector databases play a crucial role in enabling retrieval for RAG applications.\nVector databases offer a specialized way to store and query vector embeddings,\nwhich are mathematical representations of text or other data that capture\nsemantic meaning and relationships. Vector embeddings allow RAG systems to\nquickly and accurately find the most relevant information within a vast\nknowledge base, even when dealing with complex or nuanced queries. When combined\nwith an embedding model, vector databases can help overcome the limitations of\nLLMs, and provide more accurate, relevant, and comprehensive responses.\n\nSupported vector databases\n--------------------------\n\nWhen creating a RAG corpus, Vertex AI RAG Engine offers the\nenterprise-ready `RagManagedDb` as the default vector database, which requires\nno additional provisioning or managing.\n`RagManagedDb` offers both KNN and ANN search options and\nallows switching to a basic tier for some quick prototyping and experimentation.\nTo learn more about choosing a retrieval strategy on `RagManagedDb` or for\nupdating the tier, see [Use `RagManagedDb` with\nRAG](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag). For\nVertex AI RAG Engine to automatically create and manage the\nvector database for you, see [Create a RAG\ncorpus](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-params-api).\n\nIn addition to the default `RagManagedDb`, Vertex AI RAG Engine\nlets you provision and use your vector database within your RAG corpus. In this\ncase, you are responsible for the lifecycle and scalability of your vector\ndatabase.\n\nCompare vector database options\n-------------------------------\n\nThis table lists your choices of vector databases that are supported within\nVertex AI RAG Engine and provides links to pages that explain how\nto use the vector databases within your RAG corpus. \n\nWhat's next\n-----------\n\n- To create a RAG corpus, see [Create a RAG corpus\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-example-api).\n- To list all of the RAG corpora, see [List RAG corpora\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#list-rag-corpora-example-api)."]]