Panoramica di Vertex AI Vector Search

Vector Search si basa sulla tecnologia di ricerca vettoriale sviluppata da Google. Vector Search sfrutta la stessa infrastruttura che è alla base di prodotti Google come Ricerca Google, YouTube e Play.

Introduzione

La ricerca vettoriale può cercare tra miliardi di elementi semanticamente simili o correlati. Un servizio di corrispondenza delle somiglianze vettoriali ha molti casi d'uso, ad esempio l'implementazione di motori per suggerimenti, motori di ricerca, chatbot e classificazione del testo.

Query sui vestiti

Un possibile caso d'uso di Vector Search è un rivenditore online che dispone di un inventario di centinaia di migliaia di capi di abbigliamento. In questo scenario, l'API di incorporamento multimodale potrebbe aiutarli a creare incorporamenti di questi elementi e a utilizzare la ricerca vettoriale per associarli a query di testo alle immagini semanticamente simili. Ad esempio, potrebbe cercare "abito estivo giallo" e Vector Search restituisce gli elementi più simili. Vector Search può eseguire ricerche su larga scala, con un numero elevato di query al secondo (QPS), elevato richiamo, bassa latenza ed efficienza in termini di costi.

L'uso di incorporamenti non si limita alle parole o al testo. Puoi generare incorporamenti semantici per molti tipi di dati, tra cui immagini, audio, video e preferenze dell'utente. Per generare un incorporamento multimodale con Vertex AI, consulta Ottenere incorporamenti multimodali.

Come utilizzare la ricerca vettoriale per la corrispondenza semantica

La corrispondenza semantica può essere semplificata in pochi passaggi. Innanzitutto, devi generare rappresentazioni di incorporamento di molti elementi (al di fuori della ricerca vettoriale). In secondo luogo, devi caricare gli incorporamenti su Google Cloud e collegare i dati a Vector Search. Dopo aver aggiunto gli incorporamenti a Vector Search, puoi creare un indice per eseguire query e ottenere suggerimenti o risultati.

Genera un incorporamento

Genera un incorporamento per il tuo set di dati. Ciò comporta la pre-elaborazione dei dati in modo da rendere efficiente la ricerca di vicini più prossimi (ANN) approssimati. Puoi farlo al di fuori di Vertex AI o utilizzare l'IA generativa su Vertex AI per creare un incorporamento. Con l'IA generativa su Vertex AI, puoi creare incorporamenti sia di testo che multimodali.

Aggiungi l'incorporamento a Cloud Storage

Carica l'incorporamento in Cloud Storage in modo da poterlo chiamare dal servizio Vector Search.

Carica in Vector Search

Collega i tuoi incorporamenti a Vector Search per eseguire la ricerca del vicino più vicino. Puoi creare un indice dall'incorporamento, di cui puoi eseguire il deployment in un endpoint indice per eseguire una query. La query restituisce i vicini approssimativi più vicini. Per creare un indice, consulta Gestire gli indici. Per eseguire il deployment dell'indice in un endpoint, consulta Eseguire il deployment e gestire gli endpoint indice.

Valuta i risultati

Dopo aver ottenuto i risultati approssimativi del vicino più prossimo, puoi valutarli per capire se soddisfano le tue esigenze. Se i risultati non sono abbastanza precisi, puoi regolare i parametri dell'algoritmo o abilitare la scalabilità per supportare più query al secondo. Per farlo devi aggiornare il file di configurazione, che configura l'indice. Per saperne di più, consulta Configurare i parametri degli indici.

Terminologia della ricerca vettoriale

L'elenco contiene alcune importanti terminologia che dovrai comprendere per utilizzare Vector Search:

  • Vettore: un vettore è un elenco di valori mobili con magnitudo e direzione. Può essere utilizzata per rappresentare qualsiasi tipo di dati, come numeri, punti nello spazio e direzioni.
  • Incorporamento: un incorporamento è un tipo di vettore utilizzato per rappresentare i dati in modo da acquisirne il significato semantico. Gli incorporamenti, in genere, vengono creati utilizzando tecniche di machine learning e spesso sono utilizzati nell'elaborazione del linguaggio naturale (NLP) e in altre applicazioni di machine learning.
  • Indice: una raccolta di vettori utilizzati per la ricerca di somiglianze. I vettori possono essere aggiunti o rimossi da un indice. Le query per la ricerca di similitudine vengono inviate a un indice specifico e cercano i vettori in tale indice.
  • Dati empirici reali: un termine che fa riferimento alla verifica dell'accuratezza del machine learning rispetto al mondo reale, come un set di dati basato su dati empirici reali.
  • Richiamo: la percentuale di vicini più prossimi restituiti dall'indice che sono effettivamente vicini più prossimi veri. Ad esempio, se una query sul vicino più prossimo per 20 vicini più prossimi ha restituito 19 dei dati empirici reali del vicino più prossimo, il richiamo è 19/20 x 100 = 95%.

  • Limita: funzionalità che limita le ricerche a un sottoinsieme dell'indice tramite regole booleane. La limitazione è anche nota come "filtro". Con la ricerca vettoriale, puoi usare filtri numerici e di attributi di testo.

Passaggi successivi