La ricerca vettoriale si basa sulla tecnologia di ricerca vettoriale sviluppata da Google Research. Con Vector Search puoi usufruire della stessa ricerca e tecnologia che fornisce le basi per i prodotti Google come la Ricerca Google, YouTube e Play.
Introduzione
La ricerca vettoriale può eseguire ricerche tra miliardi di elementi semanticamente simili o correlati. Un servizio di ricerca di corrispondenze per similarità vettoriale ha molti casi d'uso, come l'implementazione di motori per suggerimenti, motori di ricerca, chatbot e classificazione del testo.
Un possibile caso d'uso per la ricerca di vettori è un rivenditore online che ha un inventario di centinaia di migliaia di articoli di abbigliamento. In questo scenario, l'API di incorporamento multimodale potrebbe aiutarli a creare incorporamenti di questi elementi e a utilizzare la ricerca vettoriale per abbinarli alle query di testo alle immagini semanticamente più simili. Ad esempio, potrebbe cercare "abito estivo giallo" e la ricerca vettoriale restituirà e mostrerà gli articoli più simili. Vector Search può eseguire ricerche su larga scala, con un elevato numero di query al secondo (QPS), un elevato recupero, bassa latenza ed efficienza in termini di costi.
L'uso degli incorporamenti non è limitato a parole o testo. Puoi generare embedding semantici per molti tipi di dati, tra cui immagini, audio, video e preferenze utente.
Per generare un embedding multimodale con Vertex AI, consulta Ottenere embedding multimodali.
Come utilizzare la ricerca vettoriale per la corrispondenza semantica
La corrispondenza semantica può essere semplificata in pochi passaggi. Innanzitutto, devi generare rappresentazioni di embedding di molti elementi (operazione eseguita al di fuori di Vector Search). In secondo luogo, carichi gli incorporamenti su Google Cloud e poi colleghi i dati a Ricerca vettoriale. Dopo aver aggiunto gli incorporamenti a Ricerca vettoriale, puoi creare un indice per eseguire query al fine di ottenere consigli o risultati.
Generare un'evidenziazione
Genera un embedding per il tuo set di dati. Ciò comporta la preelaborazione dei dati in modo da rendere efficiente la ricerca dei vicini più prossimi approssimativi (ANN). Puoi farlo al di fuori di Vertex AI o utilizzare l'IA generativa su Vertex AI per creare un embedding. Con l'IA generativa su Vertex AI, puoi creare rappresentazioni distribuite sia di testo che multimodali.
Aggiungi l'embedding a Cloud Storage
Carica l'embedding su Cloud Storage in modo da poterlo chiamare dal servizio Ricerca vettoriale.
Carica in Vector Search
Collega i tuoi incorporamenti a Ricerca vettoriale per eseguire la ricerca del risultato più simile. Puoi creare un indice dall'embedding, che puoi eseguire su un endpoint indice per eseguire query. La query restituisce i vicini più prossimi approssimativi.
Per creare un indice, vedi Gestire gli indici.
Per eseguire il deployment dell'indice in un endpoint, consulta Eseguire il deployment e gestire gli endpoint indice.
Valutare i risultati
Una volta ottenuti i risultati approssimativi del vicino più vicino, puoi valutarli per capire quanto soddisfano le tue esigenze. Se i risultati non sono sufficientemente precisi, modifica i parametri dell'algoritmo o attiva la scalabilità per supportare più query al secondo. Per farlo, aggiorna il file di configurazione, che configura l'indice. Per scoprire di più, consulta Configurare i parametri dell'indice.
Terminologia di Vector Search
Questo elenco contiene alcune terminologie importanti che devi conoscere per utilizzare la ricerca vettoriale:
- Vettore: un vettore è un elenco di valori float con grandezza e direzione. Può essere utilizzato per rappresentare qualsiasi tipo di dati, ad esempio numeri, punti nello spazio e indicazioni stradali.
- Incorporamento: un incorporamento è un tipo di vettore utilizzato per rappresentare i dati in modo da coglierne il significato semantico. In genere, gli embedding vengono creati utilizzando tecniche di machine learning e vengono spesso utilizzati nell'elaborazione del linguaggio naturale (NLP) e in altre applicazioni di machine learning.
- Inserimenti densi: rappresentano il significato semantico del testo utilizzando array che contengono principalmente valori diversi da zero. Con gli embedding densi, è possibile restituire risultati di ricerca simili in base alla similarità semantica.
- Embedding sparsi: gli embedding sparsi rappresentano la sintassi del testo, utilizzando array di dimensioni elevate che contengono pochissimi valori diversi da zero rispetto agli embedding densi. Gli embedding sparsi vengono spesso utilizzati per le ricerche di parole chiave.
- Ricerca ibrida: la ricerca ibrida utilizza sia embedding densi che sparsi, il che consente di eseguire ricerche in base a una combinazione di ricerca per parole chiave e ricerca semantica. La ricerca vettoriale supporta la ricerca basata su embedding di densità elevata. Come funzionalità di Anteprima pubblica, la Ricerca vettoriale supporta gli incorporamenti sparsi e la ricerca ibrida.
- Indice: una raccolta di vettori implementati insieme per la ricerca di similarità. I vettori possono essere aggiunti o rimossi da un indice. Le query di ricerca di somiglianza vengono inviate a un indice specifico e cercano i vettori in quell'indice.
- Dati empirici reali: un termine che si riferisce alla verifica dell'accuratezza del machine learning rispetto al mondo reale, ad esempio un set di dati di dati empirici reali.
Richiamo: la percentuale di vicini più vicini restituiti dall'indice che sono effettivamente veri vicini più vicini. Ad esempio, se una query sul vicino più prossimo per 20 vicini più prossimi ha restituito 19 dei vicini più prossimi del vero e proprio, il richiamo è 19/20 x 100 = 95%.
Limita: funzionalità che limita le ricerche a un sottoinsieme dell'indice utilizzando regole booleane. La limitazione è indicata anche come "filtro". Con la ricerca vettoriale, puoi utilizzare i filtri numerici e di attributi di testo.
Passaggi successivi
- Inizia a utilizzare Ricerca vettoriale in meno di un'ora con la guida rapida
- Esamina i prerequisiti e gli incorporamenti nella sezione Prima di iniziare
- Scopri come configurare il formato e la struttura dei dati di input
- Consulta altri tutorial sui notebook di Vector Search nella Panoramica dei tutorial
- Scopri di più sull'esportazione degli embedding da Spanner a Vector Search