이 페이지에서는 RagManagedDb, 기본 기술, Vertex AI RAG Engine에서 RagManagedDb를 사용하는 방법을 소개합니다. 또한 이 페이지에서는 성능을 조정하는 데 사용할 수 있는 다양한 등급을 설명하고(비용에 영향을 미칠 수 있음) 청구를 중지하는 Vertex AI RAG Engine 데이터를 삭제하는 방법을 안내합니다.
개요
Vertex AI RAG Engine은 엔터프라이즈 지원 완전 관리형 Google Spanner 인스턴스인 RagManagedDb를 사용합니다. 이 인스턴스는 Vertex AI RAG Engine에서 리소스 저장에 사용되며, 선택적으로 RAG 코퍼스의 선택한 벡터 데이터베이스로 사용할 수 있습니다.
Vertex AI RAG Engine은 Spanner를 통해 애플리케이션을 지원하는 일관되고 가용성이 높으며 확장성이 뛰어난 데이터베이스를 제공합니다. Google Spanner에 대해 자세히 알아보려면 Spanner를 참고하세요.
Vertex AI RAG Engine은 벡터 데이터베이스 선택과 관계없이 RagManagedDb에 RAG 코퍼스 및 RAG 파일 리소스 메타데이터를 저장합니다. 벡터 데이터베이스는 임베딩의 저장 및 검색에만 사용됩니다. 리소스 저장 외에도 RagManagedDb를 사용하여 문서의 벡터 표현을 저장하고 관리할 수 있습니다. 그런 다음 벡터 데이터베이스를 사용하여 특정 쿼리에 대한 문서의 시맨틱 유사성을 기반으로 관련 문서를 검색합니다.
등급 관리
Vertex AI RAG Engine을 사용하면 두 등급 중에서 선택하여 사용량 및 성능 요구사항에 따라 RagManagedDb 인스턴스를 확장할 수 있으며, 원하는 경우 세 번째 등급을 사용하여 Vertex AI RAG Engine 데이터를 삭제할 수 있습니다.
티어는 RagManagedDb을 사용하여 RAG 말뭉치에 영향을 미치는 RagEngineConfig 리소스에서 사용할 수 있는 프로젝트 수준 설정입니다. RagEngineConfig에서 사용할 수 있는 등급은 다음과 같습니다.
확장 등급: 이 등급은 자동 확장 기능과 함께 프로덕션 규모의 성능을 제공합니다. 대량의 데이터 또는 성능에 민감한 워크로드가 있는 고객에게 적합합니다. 내부적으로 이 등급은 Spanner 인스턴스를 최소 1개 노드 (처리 단위 1,000개) 및 최대 10개 노드 (처리 단위 10,000개)의 자동 확장 구성으로 설정합니다.
기본 등급 (기본값): 이 등급은 비용 효율적이고 컴퓨팅 등급이 낮으며 다음과 같은 경우에 적합할 수 있습니다.
RagManagedDb로 실험
데이터 크기가 작습니다.
지연 시간에 민감하지 않은 워크로드
다른 벡터 데이터베이스만 사용하여 Vertex AI RAG Engine을 사용합니다.
기본 등급을 제공하기 위해 RagManagedDb는 기본 Spanner 인스턴스를 0.1노드에 해당하는 100처리 단위의 고정 구성으로 설정합니다.
프로비저닝되지 않은 등급: 이 등급은 RagManagedDb 및 기본 Spanner 인스턴스를 삭제합니다. 프로비저닝되지 않음 등급에서는 Vertex AI RAG Engine 서비스를 사용 중지하고 RagCorpora에 사용된 벡터 데이터베이스와 관계없이 이 서비스 내에 저장된 데이터를 삭제합니다. 이렇게 하면 서비스 청구가 중지됩니다. 청구에 대한 자세한 내용은 Vertex AI RAG Engine 청구를 참고하세요.
데이터가 삭제되면 복구할 수 없습니다. Vertex AI RAG Engine을 다시 사용하려면 UpdateRagEngineConfig API를 호출하여 티어를 업데이트해야 합니다.
프로젝트 구성 가져오기
다음 코드 샘플은 각 등급 유형에 GetRagEngineConfig API를 사용하는 방법을 보여줍니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-10(UTC)"],[],[],null,["# Understanding RagManagedDb\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces you to `RagManagedDb`, its underlying technology, and how\n`RagManagedDb` is used in Vertex AI RAG Engine. In addition, this page\ndescribes the different tiers that are available to tune performance, which\nmight impact your costs, and provides instructions for deleting your\nVertex AI RAG Engine data, which stops billing.\n\nOverview\n--------\n\nVertex AI RAG Engine uses `RagManagedDb`, which is an enterprise-ready,\nfully-managed Google Spanner instance that's used for resource storage\nby Vertex AI RAG Engine and is optionally available to be used as\nthe [vector database of\nchoice](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag) for your RAG corpora.\n\nThrough Spanner, Vertex AI RAG Engine offers a\nconsistent, highly available, and highly scalable database to support your\napplication. To learn more about Google Spanner, see\n[Spanner](/spanner).\n\nVertex AI RAG Engine stores your RAG corpus and RAG file resource\nmetadata in `RagManagedDb`, regardless of your choice of vector database. Vector\ndatabases are only used for storage and retrieval of embeddings. In addition to\nresource storage, `RagManagedDb` can also be used to store and manage vector\nrepresentations of your documents. The vector database is then used to retrieve\nrelevant documents based on the document's semantic similarity to a given query.\n\nManage tiers\n------------\n\nVertex AI RAG Engine lets you scale your `RagManagedDb` instance based\non your usage and performance requirements using a choice of two tiers, and\noptionally, lets you delete your Vertex AI RAG Engine data using\na third tier.\n\nThe tier is a project-level setting that's available in the `RagEngineConfig`\nresource that impacts RAG corpora using `RagManagedDb`. The following tiers\nare available in `RagEngineConfig`:\n\n- **Scaled tier**: This tier offers production-scale performance along with\n autoscaling functionality. It's suitable for customers with large amounts of\n data or performance-sensitive workloads. Internally, this tier sets the\n Spanner instance to autoscaling configuration with a minimum\n of 1 node (1,000 processing units) and a maximum of 10 nodes (10,000\n processing units).\n\n- **Basic tier (default)**: This tier offers a cost-effective and low-compute\n tier, which might be suitable for some of the following cases:\n\n - Experimenting with `RagManagedDb`.\n - Small data size.\n - Latency-insensitive workload.\n - Use Vertex AI RAG Engine with only other vector databases.\n\n To offer the Basic tier, `RagManagedDb` sets the underlying\n Spanner instance to a fixed configuration of 100 processing\n units, which is equivalent to 0.1 nodes.\n- **Unprovisioned tier** : This tier deletes the `RagManagedDb` and its\n underlying Spanner instance. The Unprovisioned tier disables\n the Vertex AI RAG Engine service and deletes your data held\n within this service regardless of the vector database used for your\n `RagCorpora`. This stops the billing of the service. For more information on\n billing, see [Vertex AI RAG Engine\n billing](/vertex-ai/generative-ai/docs/rag-engine/rag_engine_billing).\n\n After the data is deleted, the data can't be recovered. To start usingVertex AI RAG Engine again, you must update the tier by\n calling the `UpdateRagEngineConfig` API.\n\n| **Note:** The Enterprise tier from the `v1beta1` version was renamed to the Scaled tier.\n\nGet the project configuration\n-----------------------------\n\nThe following code samples demonstrate how to use the `GetRagEngineConfig` API\nfor each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#get_project_configuration) API\n code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#get-project-config-for-rag) API\n code samples.\n\nUpdate the project configuration\n--------------------------------\n\nThe following code samples demonstrate how to use the `UpdateRagEngineConfig`\nAPI for each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#update_project_configuration)\n API code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#update-project-config-for-rag)\n API code samples.\n\nWhat's next\n-----------\n\n- To learn how to use the RAG API v1, the default, see [RAG API\n v1](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1).\n- To learn how to use the RAG API v1beta1, see [RAG API\n v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api).\n- To learn more about `RagManagedDb` and how to manage your tier configuration as well as the RAG corpus-level retrieval strategy, see [Use RagManagedDb with\n Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag)."]]