이 페이지에서는 RagManagedDb
, 그 기반 기술, 그리고 RagManagedDb
가 Vertex AI RAG Engine에서 어떻게 사용되는지를 소개합니다. 또한 성능을 조정할 수 있는 다양한 등급과 이로 인해 발생할 수 있는 비용 영향을 설명하며, Vertex AI RAG Engine 데이터를 삭제하여 청구가 중지되도록 하는 방법을 안내합니다.
개요
Vertex AI RAG Engine은 엔터프라이즈급으로 준비된 완전 관리형 Google Spanner 인스턴스인 RagManagedDb
를 사용합니다. 이 인스턴스는 Vertex AI RAG Engine에서 리소스를 저장하는 데 사용되며, 선택적으로 RAG 코퍼스의 벡터 데이터베이스로도 활용할 수 있습니다.
Spanner를 통해 Vertex AI RAG Engine은 애플리케이션을 지원하기 위한 일관성, 높은 가용성, 그리고 확장성을 갖춘 데이터베이스를 제공합니다. Google Spanner에 대한 자세한 내용은 Spanner를 참조하세요.
Vertex AI RAG Engine은 벡터 데이터베이스 선택과 관계없이 RAG 코퍼스와 RAG 파일 리소스 메타데이터를 RagManagedDb
에 저장합니다. 벡터 데이터베이스는 임베딩을 저장하고 검색하는 데에만 사용됩니다. RagManagedDb
는 리소스 저장 역할뿐 아니라, 문서의 벡터 표현을 저장하고 관리하는 데에도 사용할 수 있습니다. 벡터 데이터베이스는 이후 주어진 쿼리와 의미적으로 유사한 문서를 기반으로 관련 문서를 검색하는 데 사용됩니다.
등급 관리
Vertex AI RAG Engine은 사용량과 성능 요구사항에 따라 두 가지 등급 중 하나를 선택하여 RagManagedDb
인스턴스를 확장할 수 있으며, 선택적으로 세 번째 등급을 사용하여 Vertex AI RAG Engine 데이터를 삭제할 수도 있습니다.
등급은 RagManagedDb
를 사용하는 RAG 코퍼스에 영향을 주는 프로젝트 수준 설정이며, RagEngineConfig
리소스에서 설정할 수 있습니다. RagEngineConfig
에서 사용할 수 있는 등급은 다음과 같습니다.
확장 등급: 이 등급은 프로덕션 규모의 성능과 자동 확장 기능을 제공합니다. 대용량 데이터 또는 성능에 민감한 워크로드를 가진 고객에게 적합합니다. 내부적으로 이 등급은 Spanner 인스턴스를 자동 확장 구성으로 설정하며, 최소 1노드(1,000 처리 단위)에서 최대 10노드(10,000 처리 단위)까지 지원합니다.
기본 등급(기본값): 이 등급은 비용 효율적인 저사양 등급으로, 다음과 같은 경우에 적합할 수 있습니다.
RagManagedDb
실험 목적- 소규모 데이터 크기
- 지연 시간에 민감하지 않은 워크로드
- 다른 벡터 데이터베이스만으로 Vertex AI RAG Engine 사용
기본 등급을 제공하기 위해
RagManagedDb
는 기본 Spanner 인스턴스를 0.1노드에 해당하는 100 처리 단위의 고정 구성으로 설정합니다.비프로비저닝 등급: 이 등급은
RagManagedDb
및 그 기반 Spanner 인스턴스를 삭제합니다. 비프로비저닝 등급은 Vertex AI RAG Engine 서비스를 사용 중지하고RagCorpora
에 사용된 벡터 데이터베이스와 관계없이 해당 서비스 내에 저장된 데이터를 삭제합니다. 이로 인해 서비스 청구가 중지됩니다. 청구에 대한 자세한 내용은 Vertex AI RAG Engine 청구를 참조하세요.데이터를 삭제하면 복구할 수 없습니다. Vertex AI RAG Engine을 다시 사용하려면
UpdateRagEngineConfig
API를 호출하여 등급을 업데이트해야 합니다.
프로젝트 구성 가져오기
다음 코드 샘플은 각 등급 유형에 대해 GetRagEngineConfig
API를 사용하는 방법을 보여줍니다.
프로젝트 구성 업데이트
다음 코드 샘플은 각 등급 유형에 대해 UpdateRagEngineConfig
API를 사용하는 방법을 보여줍니다.
다음 단계
- 기본 버전인 RAG API v1 사용 방법을 알아보려면 RAG API v1을 참조하세요.
- RAG API v1beta1 사용 방법을 알아보려면 RAG API v1beta1을 참조하세요.
RagManagedDb
사용법, 등급 구성 관리, RAG 코퍼스 수준 검색 전략을 알아보려면 Vertex AI RAG Engine과 함께 RagManagedDb 사용을 참조하세요.