A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina ti introduce a RagManagedDb, alla sua tecnologia di base e a come
RagManagedDb viene utilizzato nel motore RAG di Vertex AI. Inoltre, questa pagina
descrive i diversi livelli disponibili per ottimizzare le prestazioni, il che
potrebbe influire sui costi, e fornisce istruzioni per eliminare i dati
di Vertex AI RAG Engine, che interrompe la fatturazione.
Panoramica
Vertex AI RAG Engine utilizza RagManagedDb, un'istanza Google Spanner completamente gestita e pronta per l'uso aziendale, utilizzata per l'archiviazione delle risorse da Vertex AI RAG Engine e disponibile facoltativamente per essere utilizzata come database vettoriale di scelta per i tuoi corpora RAG.
Tramite Spanner, Vertex AI RAG Engine offre un database coerente, a disponibilità elevata e altamente scalabile per supportare la tua applicazione. Per saperne di più su Google Spanner, consulta
Spanner.
Il motore RAG di Vertex AI archivia i metadati del corpus RAG e della risorsa file RAG in RagManagedDb, indipendentemente dalla scelta del database vettoriale. I database
vettoriali vengono utilizzati solo per l'archiviazione e il recupero degli embedding. Oltre all'archiviazione delle risorse, RagManagedDb può essere utilizzato anche per archiviare e gestire le rappresentazioni vettoriali dei documenti. Il database vettoriale viene quindi utilizzato per recuperare
documenti pertinenti in base alla somiglianza semantica del documento con una determinata query.
Gestire i livelli
Vertex AI RAG Engine ti consente di scalare l'istanza RagManagedDb in base
ai tuoi requisiti di utilizzo e prestazioni utilizzando una scelta di due livelli e, facoltativamente, ti consente di eliminare i dati di Vertex AI RAG Engine utilizzando
un terzo livello.
Il livello è un'impostazione a livello di progetto disponibile nella risorsa RagEngineConfig
che influisce sui corpus RAG utilizzando RagManagedDb. In RagEngineConfig sono disponibili
i seguenti livelli:
Livello scalato: questo livello offre prestazioni su scala di produzione insieme alla funzionalità di scalabilità automatica. È adatto ai clienti con grandi quantità di dati o workload sensibili alle prestazioni. Internamente, questo livello imposta l'istanza Spanner sulla configurazione di scalabilità automatica con un minimo di 1 nodo (1000 unità di elaborazione) e un massimo di 10 nodi (10.000 unità di elaborazione).
Livello di base (predefinito): questo livello offre un livello di computing
economico e a basso costo, che potrebbe essere adatto ad alcuni dei seguenti casi:
È in corso l'esperimento con RagManagedDb.
Dati di piccole dimensioni.
Workload non sensibili alla latenza.
Utilizza Vertex AI RAG Engine solo con altri database vettoriali.
Per offrire il livello base, RagManagedDb imposta l'istanza Spanner sottostante su una configurazione fissa di 100 unità di elaborazione, che equivale a 0,1 nodi.
Livello di cui non è stato eseguito il provisioning: questo livello elimina RagManagedDb e la relativa istanza Spanner sottostante. Il livello Non provisionato disattiva
il servizio Vertex AI RAG Engine ed elimina i dati contenuti
in questo servizio indipendentemente dal database vettoriale utilizzato per
RagCorpora. In questo modo, la fatturazione del servizio viene interrotta. Per ulteriori informazioni sulla
fatturazione, consulta Fatturazione di Vertex AI RAG Engine.
Una volta eliminati, i dati non possono essere recuperati. Per ricominciare a utilizzare Vertex AI RAG Engine, devi aggiornare il livello chiamando l'API UpdateRagEngineConfig.
Ottieni la configurazione del progetto
I seguenti esempi di codice mostrano come utilizzare l'API GetRagEngineConfig
per ogni tipo di livello:
Per scoprire come utilizzare l'API RAG v1, quella predefinita, consulta API RAG v1.
Per scoprire come utilizzare l'API RAG v1beta1, consulta API RAG
v1beta1.
Per saperne di più su RagManagedDb e su come gestire la configurazione del livello
e la strategia di recupero a livello di corpus RAG, consulta Utilizzare RagManagedDb con
Vertex AI RAG Engine.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Understanding RagManagedDb\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces you to `RagManagedDb`, its underlying technology, and how\n`RagManagedDb` is used in Vertex AI RAG Engine. In addition, this page\ndescribes the different tiers that are available to tune performance, which\nmight impact your costs, and provides instructions for deleting your\nVertex AI RAG Engine data, which stops billing.\n\nOverview\n--------\n\nVertex AI RAG Engine uses `RagManagedDb`, which is an enterprise-ready,\nfully-managed Google Spanner instance that's used for resource storage\nby Vertex AI RAG Engine and is optionally available to be used as\nthe [vector database of\nchoice](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag) for your RAG corpora.\n\nThrough Spanner, Vertex AI RAG Engine offers a\nconsistent, highly available, and highly scalable database to support your\napplication. To learn more about Google Spanner, see\n[Spanner](/spanner).\n\nVertex AI RAG Engine stores your RAG corpus and RAG file resource\nmetadata in `RagManagedDb`, regardless of your choice of vector database. Vector\ndatabases are only used for storage and retrieval of embeddings. In addition to\nresource storage, `RagManagedDb` can also be used to store and manage vector\nrepresentations of your documents. The vector database is then used to retrieve\nrelevant documents based on the document's semantic similarity to a given query.\n\nManage tiers\n------------\n\nVertex AI RAG Engine lets you scale your `RagManagedDb` instance based\non your usage and performance requirements using a choice of two tiers, and\noptionally, lets you delete your Vertex AI RAG Engine data using\na third tier.\n\nThe tier is a project-level setting that's available in the `RagEngineConfig`\nresource that impacts RAG corpora using `RagManagedDb`. The following tiers\nare available in `RagEngineConfig`:\n\n- **Scaled tier**: This tier offers production-scale performance along with\n autoscaling functionality. It's suitable for customers with large amounts of\n data or performance-sensitive workloads. Internally, this tier sets the\n Spanner instance to autoscaling configuration with a minimum\n of 1 node (1,000 processing units) and a maximum of 10 nodes (10,000\n processing units).\n\n- **Basic tier (default)**: This tier offers a cost-effective and low-compute\n tier, which might be suitable for some of the following cases:\n\n - Experimenting with `RagManagedDb`.\n - Small data size.\n - Latency-insensitive workload.\n - Use Vertex AI RAG Engine with only other vector databases.\n\n To offer the Basic tier, `RagManagedDb` sets the underlying\n Spanner instance to a fixed configuration of 100 processing\n units, which is equivalent to 0.1 nodes.\n- **Unprovisioned tier** : This tier deletes the `RagManagedDb` and its\n underlying Spanner instance. The Unprovisioned tier disables\n the Vertex AI RAG Engine service and deletes your data held\n within this service regardless of the vector database used for your\n `RagCorpora`. This stops the billing of the service. For more information on\n billing, see [Vertex AI RAG Engine\n billing](/vertex-ai/generative-ai/docs/rag-engine/rag_engine_billing).\n\n After the data is deleted, the data can't be recovered. To start usingVertex AI RAG Engine again, you must update the tier by\n calling the `UpdateRagEngineConfig` API.\n\n| **Note:** The Enterprise tier from the `v1beta1` version was renamed to the Scaled tier.\n\nGet the project configuration\n-----------------------------\n\nThe following code samples demonstrate how to use the `GetRagEngineConfig` API\nfor each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#get_project_configuration) API\n code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#get-project-config-for-rag) API\n code samples.\n\nUpdate the project configuration\n--------------------------------\n\nThe following code samples demonstrate how to use the `UpdateRagEngineConfig`\nAPI for each type of tier:\n\n- [Version 1\n (v1)](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1#update_project_configuration)\n API code samples.\n\n- [v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api#update-project-config-for-rag)\n API code samples.\n\nWhat's next\n-----------\n\n- To learn how to use the RAG API v1, the default, see [RAG API\n v1](/vertex-ai/generative-ai/docs/model-reference/rag-api-v1).\n- To learn how to use the RAG API v1beta1, see [RAG API\n v1beta1](/vertex-ai/generative-ai/docs/model-reference/rag-api).\n- To learn more about `RagManagedDb` and how to manage your tier configuration as well as the RAG corpus-level retrieval strategy, see [Use RagManagedDb with\n Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag)."]]