Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Cette page vous présente RagManagedDb, sa technologie sous-jacente et son utilisation dans le moteur RAG Vertex AI.RagManagedDb Cette page décrit également les différents niveaux disponibles pour ajuster les performances, ce qui peut avoir un impact sur vos coûts. Elle fournit également des instructions pour supprimer vos données Vertex AI RAG Engine, ce qui arrête la facturation.
Présentation
Le moteur RAG Vertex AI utilise RagManagedDb, une instance Google Spanner entièrement gérée et adaptée aux entreprises, qui est utilisée pour le stockage des ressources par le moteur RAG Vertex AI et qui peut éventuellement être utilisée comme base de données vectorielle de votre choix pour vos corpus RAG.
Grâce à Spanner, le moteur RAG Vertex AI offre une base de données cohérente, disponibilité élevée et évolutive pour prendre en charge votre application. Pour en savoir plus sur Google Spanner, consultez Spanner.
Le moteur RAG Vertex AI stocke les métadonnées de votre corpus RAG et de votre ressource de fichier RAG dans RagManagedDb, quel que soit votre choix de base de données vectorielle. Les bases de données vectorielles ne sont utilisées que pour le stockage et la récupération des embeddings. En plus du stockage des ressources, RagManagedDb peut également être utilisé pour stocker et gérer les représentations vectorielles de vos documents. La base de données vectorielle est ensuite utilisée pour récupérer les documents pertinents en fonction de leur similarité sémantique avec une requête donnée.
Gérer les niveaux
Le moteur RAG Vertex AI vous permet de faire évoluer votre instance RagManagedDb en fonction de vos besoins en termes d'utilisation et de performances en choisissant l'un des deux niveaux. Il vous permet également de supprimer vos données Vertex AI RAG Engine à l'aide d'un troisième niveau.
Le niveau est un paramètre au niveau du projet disponible dans la ressource RagEngineConfig qui a un impact sur les corpus RAG utilisant RagManagedDb. Les niveaux suivants sont disponibles dans RagEngineConfig :
Niveau avec scaling : ce niveau offre des performances de niveau production ainsi qu'une fonctionnalité d'autoscaling. Il convient aux clients disposant de grandes quantités de données ou de charges de travail sensibles aux performances. En interne, ce niveau définit l'instance Spanner sur une configuration d'autoscaling avec un minimum de 1 nœud (1 000 unités de traitement) et un maximum de 10 nœuds (10 000 unités de traitement).
Niveau de base (par défaut) : ce niveau offre un coût et une puissance de calcul faibles, ce qui peut convenir dans certains des cas suivants :
Tester RagManagedDb
Petit volume de données.
Charge de travail insensible à la latence.
Utilisez le moteur RAG Vertex AI uniquement avec d'autres bases de données vectorielles.
Pour proposer le niveau de base, RagManagedDb définit l'instance Spanner sous-jacente sur une configuration fixe de 100 unités de traitement, ce qui équivaut à 0,1 nœud.
Niveau non provisionné : ce niveau supprime RagManagedDb et son instance Spanner sous-jacente. Le niveau "Non provisionné" désactive le service Vertex AI RAG Engine et supprime les données qu'il contient, quelle que soit la base de données vectorielle utilisée pour votre RagCorpora. La facturation du service est alors interrompue. Pour en savoir plus sur la facturation, consultez Facturation du moteur RAG de Vertex AI.
Une fois les données supprimées, vous ne pourrez plus les récupérer. Pour recommencer à utiliser le moteur RAG Vertex AI, vous devez modifier le niveau en appelant l'API UpdateRagEngineConfig.
Obtenir la configuration du projet
Les exemples de code suivants montrent comment utiliser l'API GetRagEngineConfig pour chaque type de niveau :
Pour savoir comment utiliser l'API RAG v1, qui est l'API par défaut, consultez API RAG v1.
Pour savoir comment utiliser l'API RAG v1beta1, consultez API RAG v1beta1.
Pour en savoir plus sur RagManagedDb et sur la façon de gérer la configuration de votre niveau ainsi que la stratégie de récupération au niveau du corpus RAG, consultez Utiliser RagManagedDb avec le moteur RAG Vertex AI.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Understanding RagManagedDb\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces you to `RagManagedDb`, its underlying technology, and how\n`RagManagedDb` is used in Vertex AI RAG Engine. In addition, this page\ndescribes the different tiers that are available to tune performance, which\nmight impact your costs, and provides instructions for deleting your\nVertex AI RAG Engine data, which stops billing.\n\nOverview\n--------\n\nVertex AI RAG Engine uses `RagManagedDb`, which is an enterprise-ready,\nfully-managed Google Spanner instance that's used for resource storage\nby Vertex AI RAG Engine and is optionally available to be used as\nthe [vector database of\nchoice](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag) for your RAG corpora.\n\nThrough Spanner, Vertex AI RAG Engine offers a\nconsistent, highly available, and highly scalable database to support your\napplication. To learn more about Google Spanner, see\n[Spanner](/spanner).\n\nVertex AI RAG Engine stores your RAG corpus and RAG file resource\nmetadata in `RagManagedDb`, regardless of your choice of vector database. Vector\ndatabases are only used for storage and retrieval of embeddings. In addition to\nresource storage, `RagManagedDb` can also be used to store and manage vector\nrepresentations of your documents. The vector database is then used to retrieve\nrelevant documents based on the document's semantic similarity to a given query.\n\nManage tiers\n------------\n\nVertex AI RAG Engine lets you scale your `RagManagedDb` instance based\non your usage and performance requirements using a choice of two tiers, and\noptionally, lets you delete your Vertex AI RAG Engine data using\na third tier.\n\nThe tier is a project-level setting that's available in the `RagEngineConfig`\nresource that impacts RAG corpora using `RagManagedDb`. The following tiers\nare available in `RagEngineConfig`:\n\n- **Scaled tier**: This tier offers production-scale performance along with\n autoscaling functionality. It's suitable for customers with large amounts of\n data or performance-sensitive workloads. Internally, this tier sets the\n Spanner instance to autoscaling configuration with a minimum\n of 1 node (1,000 processing units) and a maximum of 10 nodes (10,000\n processing units).\n\n- **Basic tier (default)**: This tier offers a cost-effective and low-compute\n tier, which might be suitable for some of the following cases:\n\n - Experimenting with `RagManagedDb`.\n - Small data size.\n - Latency-insensitive workload.\n - Use Vertex AI RAG Engine with only other vector databases.\n\n To offer the Basic tier, `RagManagedDb` sets the underlying\n Spanner instance to a fixed configuration of 100 processing\n units, which is equivalent to 0.1 nodes.\n- **Unprovisioned tier** : This tier deletes the `RagManagedDb` and its\n underlying Spanner instance. The Unprovisioned tier disables\n the Vertex AI RAG Engine service and deletes your data held\n within this service regardless of the vector database used for your\n `RagCorpora`. This stops the billing of the service. For more information on\n billing, see [Vertex AI RAG Engine\n billing](/vertex-ai/generative-ai/docs/rag-engine/rag_engine_billing).\n\n After the data is deleted, the data can't be recovered. To start usingVertex AI RAG Engine again, you must update the tier by\n calling the `UpdateRagEngineConfig` API.\n\n| **Note:** The Enterprise tier from the `v1beta1` version was renamed to the Scaled tier.\n\nGet the project configuration\n-----------------------------\n\nThe following code samples demonstrate how to use the `GetRagEngineConfig` API\nfor each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#get_project_configuration) API\n code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#get-project-config-for-rag) API\n code samples.\n\nUpdate the project configuration\n--------------------------------\n\nThe following code samples demonstrate how to use the `UpdateRagEngineConfig`\nAPI for each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#update_project_configuration)\n API code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#update-project-config-for-rag)\n API code samples.\n\nWhat's next\n-----------\n\n- To learn how to use the RAG API v1, the default, see [RAG API\n v1](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1).\n- To learn how to use the RAG API v1beta1, see [RAG API\n v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api).\n- To learn more about `RagManagedDb` and how to manage your tier configuration as well as the RAG corpus-level retrieval strategy, see [Use RagManagedDb with\n Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag)."]]