Informazioni su RagManagedDb

Questa pagina ti introduce a RagManagedDb, alla sua tecnologia di base e a come RagManagedDb viene utilizzato nel motore RAG di Vertex AI. Inoltre, questa pagina descrive i diversi livelli disponibili per ottimizzare le prestazioni, il che potrebbe influire sui costi, e fornisce istruzioni per eliminare i dati di Vertex AI RAG Engine, che interrompe la fatturazione.

Panoramica

Vertex AI RAG Engine utilizza RagManagedDb, un'istanza Google Spanner completamente gestita e pronta per l'uso aziendale, utilizzata per l'archiviazione delle risorse da Vertex AI RAG Engine e disponibile facoltativamente per essere utilizzata come database vettoriale di scelta per i tuoi corpora RAG.

Tramite Spanner, Vertex AI RAG Engine offre un database coerente, a disponibilità elevata e altamente scalabile per supportare la tua applicazione. Per saperne di più su Google Spanner, consulta Spanner.

Il motore RAG di Vertex AI archivia i metadati del corpus RAG e della risorsa file RAG in RagManagedDb, indipendentemente dalla scelta del database vettoriale. I database vettoriali vengono utilizzati solo per l'archiviazione e il recupero degli embedding. Oltre all'archiviazione delle risorse, RagManagedDb può essere utilizzato anche per archiviare e gestire le rappresentazioni vettoriali dei documenti. Il database vettoriale viene quindi utilizzato per recuperare documenti pertinenti in base alla somiglianza semantica del documento con una determinata query.

Gestire i livelli

Vertex AI RAG Engine ti consente di scalare l'istanza RagManagedDb in base ai tuoi requisiti di utilizzo e prestazioni utilizzando una scelta di due livelli e, facoltativamente, ti consente di eliminare i dati di Vertex AI RAG Engine utilizzando un terzo livello.

Il livello è un'impostazione a livello di progetto disponibile nella risorsa RagEngineConfig che influisce sui corpus RAG utilizzando RagManagedDb. In RagEngineConfig sono disponibili i seguenti livelli:

  • Livello scalato: questo livello offre prestazioni su scala di produzione insieme alla funzionalità di scalabilità automatica. È adatto ai clienti con grandi quantità di dati o workload sensibili alle prestazioni. Internamente, questo livello imposta l'istanza Spanner sulla configurazione di scalabilità automatica con un minimo di 1 nodo (1000 unità di elaborazione) e un massimo di 10 nodi (10.000 unità di elaborazione).

  • Livello di base (predefinito): questo livello offre un livello di computing economico e a basso costo, che potrebbe essere adatto ad alcuni dei seguenti casi:

    • È in corso l'esperimento con RagManagedDb.
    • Dati di piccole dimensioni.
    • Workload non sensibili alla latenza.
    • Utilizza Vertex AI RAG Engine solo con altri database vettoriali.

    Per offrire il livello base, RagManagedDb imposta l'istanza Spanner sottostante su una configurazione fissa di 100 unità di elaborazione, che equivale a 0,1 nodi.

  • Livello di cui non è stato eseguito il provisioning: questo livello elimina RagManagedDb e la relativa istanza Spanner sottostante. Il livello Non provisionato disattiva il servizio Vertex AI RAG Engine ed elimina i dati contenuti in questo servizio indipendentemente dal database vettoriale utilizzato per RagCorpora. In questo modo, la fatturazione del servizio viene interrotta. Per ulteriori informazioni sulla fatturazione, consulta Fatturazione di Vertex AI RAG Engine.

    Una volta eliminati, i dati non possono essere recuperati. Per ricominciare a utilizzare Vertex AI RAG Engine, devi aggiornare il livello chiamando l'API UpdateRagEngineConfig.

Ottieni la configurazione del progetto

I seguenti esempi di codice mostrano come utilizzare l'API GetRagEngineConfig per ogni tipo di livello:

Aggiorna la configurazione del progetto

I seguenti esempi di codice mostrano come utilizzare l'API UpdateRagEngineConfig per ogni tipo di livello:

Passaggi successivi