Panoramica di Vertex AI Vector Search

La ricerca vettoriale si basa sulla tecnologia di ricerca vettoriale sviluppata da ricerca Google. Con Vector Search puoi sfruttare la stessa infrastruttura che fornisce la base per prodotti Google come Ricerca Google, YouTube e Play.

Introduzione

La ricerca vettoriale è in grado di eseguire ricerche da miliardi di elementi semanticamente simili o semanticamente correlati. Un servizio di ricerca di corrispondenze per similarità vettoriale ha molti casi d'uso, come l'implementazione di motori per suggerimenti, motori di ricerca, chatbot e classificazione del testo.

Query su abiti

Un possibile caso d'uso di Vector Search è un rivenditore online che ha un inventario di centinaia di migliaia di articoli di abbigliamento. In questo scenario, l'API di incorporamento multimodale potrebbe aiutarli a creare incorporamenti di questi elementi. e usare Vector Search per abbinarli a query di testo a le immagini più semanticamente simili. Ad esempio, potrebbero cercare "vestito estivo giallo" e la ricerca vettoriale restituisce per visualizzare gli elementi più simili. La ricerca vettoriale può eseguire ricerche in su vasta scala, con un numero elevato di query al secondo (QPS), un elevato richiamo, una bassa latenza ed un'efficienza in termini di costi.

L'uso degli incorporamenti non è limitato a parole o testo. Puoi generare testi semantici per molti tipi di dati, tra cui immagini, audio, video e preferenze dell'utente. Per generare un incorporamento multimodale con Vertex AI, consulta Ottieni incorporamenti multimodali.

Come utilizzare la ricerca vettoriale per la corrispondenza semantica

La corrispondenza semantica può essere semplificata in pochi passaggi. Innanzitutto, devi generare di incorporamento di rappresentazioni di molti elementi (al di fuori di Vector Search). In secondo luogo, carichi gli incorporamenti su Google Cloud e poi colleghi i dati a Ricerca vettoriale. Dopo aver aggiunto gli incorporamenti a Vector Search, puoi creare un indice per eseguire query e ottenere suggerimenti o risultati.

Generare un incorporamento

Genera un embedding per il tuo set di dati. Ciò comporta la pre-elaborazione dei dati un modo che rende efficiente la ricerca del vicino più prossimo approssimato (ANN). Puoi farlo al di fuori di Vertex AI o utilizzare l'IA generativa su Vertex AI per creare un embedding. Con Grazie all'IA generativa su Vertex AI, puoi creare incorporamenti sia di testo che multimodali.

Aggiungi l'embedding a Cloud Storage

Carica l'incorporamento su Cloud Storage in modo da poterlo chiamare dal Servizio di ricerca vettoriale.

Carica in Vector Search

Collega i tuoi incorporamenti a Ricerca vettoriale per eseguire la ricerca del risultato più simile. Puoi creare un indice dall'embedding, che puoi eseguire su un endpoint indice per eseguire query. La query restituisce i vicini più prossimi approssimativi. Per creare un indice, consulta Gestire gli indici. Per eseguire il deployment dell'indice in un endpoint, consulta Eseguire il deployment e gestire gli endpoint indice.

Valutare i risultati

Dopo aver ottenuto i risultati approssimativi per il vicino più prossimo, puoi valutarli per capire se soddisfano le tue esigenze. Se i risultati non sono abbastanza precisi, puoi regolare i parametri dell'algoritmo o abilitare la scalabilità per supportare di query al secondo in più. Per farlo, devi aggiornare il file di configurazione, che configura il tuo indice. Per scoprire di più, consulta Configurare i parametri dell'indice.

Terminologia della ricerca vettoriale

Questo elenco contiene alcuni termini importanti che dovrai comprendere per utilizza la ricerca vettoriale:

  • Vettore: un vettore è un elenco di valori in virgola mobile con magnitudo e direzione. Può essere utilizzato per rappresentare qualsiasi tipo di dati, ad esempio numeri, punti nello spazio e indicazioni stradali.
  • Incorporamento: un incorporamento è un tipo di vettore utilizzato per rappresentare. in un modo che catturi il loro significato semantico. In genere gli incorporamenti vengono creati utilizzando tecniche di machine learning, spesso usate in linguaggio naturale dell'elaborazione dei dati (NLP) e altre applicazioni di machine learning.
    • Inserimenti densi: rappresentano il significato semantico del testo utilizzando array che contengono principalmente valori diversi da zero. Ad alta densità incorporamenti, risultati di ricerca simili possono essere restituiti in base alla semantica le similitudini.
    • Incorporamenti sparsi: gli incorporamenti sparsi rappresentano la sintassi del testo, utilizzando array ad alta dimensionalità che contengono pochissimi valori diversi da zero rispetto agli incorporamenti densi. Gli embedding sparsi vengono spesso utilizzati per le ricerche di parole chiave.
  • Ricerca ibrida: la ricerca ibrida utilizza sia embedding densi che sparsi, il che consente di eseguire ricerche in base a una combinazione di ricerca per parole chiave e ricerca semantica. La ricerca vettoriale supporta la ricerca basata su embedding di densità elevata. Come funzionalità di Anteprima pubblica, Vector Search supporta incorporamenti sparsi e ricerca ibrida.
  • Indice: una raccolta di vettori distribuiti insieme per la ricerca di analogie. I vettori possono essere aggiunti o rimossi da un indice. Ricerca di affinità vengono inviate a un indice specifico e cercano i vettori al suo interno.
  • Dati empirici reali: un termine che si riferisce alla verifica dell'accuratezza del machine learning rispetto al mondo reale, ad esempio un set di dati di dati empirici reali.
  • Richiamo: la percentuale di vicini più vicini restituiti dall'indice che sono effettivamente veri vicini più vicini. Ad esempio, se una query sul vicino più prossimo per 20 vicini più prossimi hanno restituito 19 dei vicini più prossimi basati su dati empirici reali, il richiamo è 19/20x100 = 95%.

  • Limita: funzionalità che limita le ricerche a un sottoinsieme dell'indice per usando le regole booleane. La limitazione è indicata anche come "filtro". Con la ricerca vettoriale, puoi utilizzare i filtri numerici e di attributi di testo.

Passaggi successivi