Questa pagina illustra le opzioni di un database vettoriale supportato sul motore RAG di Vertex AI. Puoi anche scoprire come collegare un database di vettori (magazzino di vettori) al tuo corpus RAG.
Un problema comune degli LLM è che non comprendono le conoscenze private, ovvero i dati della tua organizzazione. Con il motore RAG di Vertex AI, puoi arricchire il contesto del modello LLM con informazioni private aggiuntive, perché il modello può ridurre le allucinazioni e rispondere alle domande in modo più preciso.
I database vettoriali svolgono un ruolo fondamentale nel consentire il recupero per le applicazioni RAG. I database vettoriali offrono un modo specializzato per archiviare ed eseguire query sugli incorporamenti vettoriali, che sono rappresentazioni matematiche di testo o altri dati che acquisiscono significato e relazioni semantiche. Gli embedding vettoriali consentono ai sistemi RAG di trovare rapidamente e con precisione le informazioni più pertinenti all'interno di una vasta knowledge base, anche quando si tratta di query complesse o sfumate. Se combinati con un modello di incorporamento, i database vettoriali possono contribuire a superare i limiti degli LLM e fornire risposte più accurate, pertinenti e complete.
Database vettoriali supportati
Quando crei un corpus RAG, il motore RAG di Vertex AI offre RagManagedDb
come scelta predefinita per un database vettoriale, che non richiede provisioning o gestione aggiuntivi. Per consentire al motore RAG di Vertex AI di creare e gestire automaticamente il database di vettori, consulta Creare un corpus RAG.
Oltre a RagManagedDb
predefinito, il motore RAG di Vertex AI ti consente di eseguire il provisioning e di utilizzare il tuo database vettoriale all'interno del corpus RAG. In questo caso,
sei responsabile del ciclo di vita e della scalabilità del tuo database di vettori.
Confronta le opzioni del database di vettori
Questa tabella elenca le opzioni di database vettoriali supportate nel motore RAG di Vertex AI e fornisce link a pagine che spiegano come utilizzare i database vettoriali all'interno del corpus RAG.
Per identificare il database vettoriale che soddisfa le tue esigenze, utilizza questa tabella per confrontare le opzioni di database vettoriale:
Database vettoriale | Descrizione | Vantaggi | Svantaggi | Metriche di distanza supportate nel motore RAG di Vertex AI | Tipo di ricerca | Fase di lancio nel motore RAG di Vertex AI | Pronta per la produzione | Ideale per |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
RagManagedDb è un servizio di database scalabile distribuito a livello di regione che offre coerenza e alta disponibilità.RagManagedDb può essere utilizzato per una ricerca di vettori.
|
|
|
cosine |
KNN | Anteprima |
|
|
Ricerca vettoriale | Vector Search è il servizio di database vettoriale all'interno di Vertex AI. Vector Search è ottimizzato per le attività di machine learning e si integra con altri Google Cloud servizi. |
|
|
cosine dot-product |
ANN | GA |
|
|
Vertex AI Feature Store | Vertex AI Feature Store è un servizio gestito per organizzare, archiviare e distribuire le funzionalità di machine learning. Vertex AI Feature Store è ottimizzato per le attività di machine learning e si integra con altri Google Cloud servizi. |
|
|
cosine dot-product L2 squared |
ANN | Anteprima |
|
|
Weaviate | Weaviate è un database vettoriale open source incentrato su flessibilità e modularità. Weaviate supporta vari tipi di dati e offre funzionalità di grafo integrate. |
|
|
cosine dot-product L2 squared hamming manhattan |
Supporto ANN + ricerca ibrida | Anteprima |
|
|
Pinecone | Pinecone è un database vettoriale cloud-native completamente gestito progettato per una ricerca di similarità ad alte prestazioni. |
|
|
cosine euclidean dot-product |
ANN | GA |
|