이 페이지에서는 RAG 엔진에서 지원되는 벡터 데이터베이스 선택사항을 소개합니다. 벡터 데이터베이스 (벡터 저장소)를 RAG 코퍼스에 연결하는 방법도 확인할 수 있습니다.
LLM의 일반적인 문제는 비공개 지식, 즉 조직의 데이터를 이해하지 못한다는 것입니다. RAG 엔진을 사용하면 추가 비공개 정보로 LLM 컨텍스트를 보강할 수 있습니다. 모델이 할루시네이션을 줄이고 질문에 더 정확하게 답변할 수 있기 때문입니다.
벡터 데이터베이스는 RAG 애플리케이션의 검색을 지원하는 데 중요한 역할을 합니다. 벡터 데이터베이스는 의미론적 의미와 관계를 포착하는 텍스트 또는 기타 데이터의 수학적 표현인 벡터 임베딩을 저장하고 쿼리하는 특수한 방법을 제공합니다. 벡터 임베딩을 사용하면 RAG 시스템이 복잡하거나 미묘한 검색어를 처리할 때도 방대한 지식 베이스에서 가장 관련성 높은 정보를 빠르고 정확하게 찾을 수 있습니다. 벡터 데이터베이스는 임베딩 모델과 결합하면 LLM의 한계를 극복하고 더 정확하고 관련성 높은 포괄적인 응답을 제공하는 데 도움이 됩니다.
지원되는 벡터 데이터베이스
RAG 자료집을 만들 때 RAG 엔진은 추가 프로비저닝이나 관리가 필요 없는 벡터 데이터베이스의 기본 선택사항으로 RagManagedDb
를 제공합니다. RAG 엔진이 자동으로 벡터 데이터베이스를 만들고 관리하도록 하려면 RAG 자료 만들기를 참고하세요.
RAG 엔진을 사용하면 기본 RagManagedDb
외에도 벡터 데이터베이스를 프로비저닝하고 가져와 RAG 코퍼스 내에서 사용할 수 있습니다. 이 경우 벡터 데이터베이스의 수명 주기와 확장성을 개발자가 책임집니다.
벡터 데이터베이스 옵션 비교
이 표에는 RAG 엔진에서 지원되는 벡터 데이터베이스의 선택사항이 나열되어 있으며 RAG 코퍼스 내에서 벡터 데이터베이스를 사용하는 방법을 설명하는 페이지로 연결되는 링크가 제공됩니다.
요구사항을 충족하는 벡터 데이터베이스를 식별하려면 이 표를 사용하여 벡터 데이터베이스 옵션을 비교하세요.
벡터 데이터베이스 | 설명 | 이점 | 단점 | RAG 엔진에서 지원되는 거리 측정항목 | 검색 유형 | RAG Engine의 실행 단계 | 프로덕션 준비 | 권장 |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
RagManagedDb 는 일관성과 고가용성을 제공하는 지역별로 분산된 확장 가능한 데이터베이스 서비스입니다.RagManagedDb 는 벡터 검색에 사용할 수 있습니다.
|
|
|
cosine |
KNN | 미리보기 |
|
|
Pinecone | Pinecone은 고성능 유사성 검색을 위해 설계된 완전 관리형 클라우드 네이티브 벡터 데이터베이스입니다. |
|
|
cosine euclidean dot-product |
ANN | 미리보기 |
|
|
Weaviate | Weaviate는 유연성과 모듈성에 중점을 둔 오픈소스 벡터 데이터베이스입니다. Weaviate는 다양한 데이터 유형을 지원하고 내장 그래프 기능을 제공합니다. |
|
|
cosine dot-product L2 squared hamming manhattan |
ANN + 하이브리드 검색 지원 | 미리보기 |
|
|
벡터 검색 | 벡터 검색은 Vertex AI 내의 벡터 데이터베이스 서비스입니다. 벡터 검색은 머신러닝 작업에 최적화되어 있으며 다른 Google Cloud 서비스와 통합됩니다. |
|
|
cosine dot-product |
ANN | 미리보기 |
|
|
Vertex AI Feature Store | Vertex AI Feature Store는 머신러닝 특성을 구성, 저장, 제공하기 위한 관리형 서비스입니다. Vertex AI Feature Store는 머신러닝 작업에 최적화되어 있으며 다른 Google Cloud 서비스와 통합됩니다. |
|
|
cosine dot-product L2 squared |
ANN | 미리보기 |
|
다음 단계
- 임베딩 모델 선택에 관한 자세한 내용은 RAG 엔진에서 임베딩 모델 사용을 참고하세요.
- RAG 엔진에 대한 자세한 내용은 RAG 엔진 개요를 참고하세요.