Prova la potenza della tecnologia di ricerca vettoriale all'avanguardia con la demo interattiva di Ricerca vettoriale. Sfruttando set di dati reali, la demo fornisce un esempio realistico che ti aiuterà a scoprire come funziona la ricerca vettoriale, a esplorare la ricerca semantica e ibrida e a vedere il ricoindicizzazione in azione. Invia una breve descrizione di un animale, di una pianta, di un prodotto di e-commerce o di un altro articolo e lascia che sia Vector Search a fare il resto.
Prova
Prova le diverse opzioni nella demo per iniziare subito a utilizzare la ricerca vettoriale e comprendere le nozioni di base della tecnologia di ricerca vettoriale.
Per eseguire:
Nel campo di testo Query, descrivi gli elementi per cui vuoi eseguire una query (ad es.
vintage 1970s pinball machine
). In alternativa, fai clic su Genera query per generare automaticamente una descrizione.Fai clic su Invia.
Per scoprire di più su cosa puoi fare nella demo, consulta Interfaccia utente.
Interfaccia utente
Questa sezione descrive le impostazioni dell'interfaccia utente che puoi utilizzare per controllare i risultati restituiti da Ricerca di vettori e il relativo ranking.
Set di dati
Utilizza il menu a discesa Set di dati per scegliere il set di dati su cui Vector Search eseguire la query. Per informazioni dettagliate su ciascun set di dati, consulta Set di dati.
Query
Per il campo Query, aggiungi una descrizione o una o più parole chiave per specificare gli elementi che vuoi che la ricerca vettoriale trovi. In alternativa, fai clic su Genera query per generare automaticamente una descrizione.
Modifica
Sono disponibili diverse opzioni per modificare i risultati restituiti da Ricerca vettoriale:
Fai clic su Righe e scegli il numero massimo di risultati di ricerca che vuoi che la ricerca vettoriale restituisca.
Seleziona Utilizza embedding densi se vuoi che la ricerca vettoriale restituisca risultati semanticamente simili.
Seleziona Utilizza incorporamenti sparsi se vuoi che la ricerca vettoriale restituisca risultati in base alla sintassi del testo della query. Non tutti i set di dati disponibili supportano i modelli di embedding sparsi.
Seleziona sia Utilizza embedding densi sia Utilizza embedding sparsi se vuoi che la ricerca vettoriale utilizzi la ricerca ibrida. Non tutti i set di dati supportano questo modello. La ricerca ibrida combina elementi di embedding sia densi che sparsi, che possono migliorare la qualità dei risultati di ricerca. Per saperne di più, consulta Informazioni sulla ricerca ibrida.
Nel campo RRF Alpha, inserisci un valore compreso tra 0,0 e 1,0 per specificare l'effetto del ranking RRF.
Per rieseguire il ranking dei risultati di ricerca, seleziona ranking_api dal menu a discesa Ranking o Nessuna per disattivare il ranking.
Metriche
Dopo l'esecuzione di una query, vengono fornite le metriche sulla latenza che suddividono il tempo necessario per completare le diverse fasi di ricerca.
Processo di query
Quando viene elaborata una query, si verifica quanto segue:
Generare incorporamenti delle query:viene generato un incorporamento per il testo della query specificato.
Query di ricerca vettoriale:la query viene eseguita con l'indice di ricerca vettoriale.
Recupero da Vertex AI Feature Store: le caratteristiche (ad es. nome dell'articolo, descrizione o URL immagine) vengono lette da Vertex AI Feature Store utilizzando l'elenco degli ID articolo restituiti dalla Ricerca vettoriale.
Nuovo ranking:gli elementi recuperati vengono ordinati tramite API di ranking che utilizzano il testo della query, il nome e la descrizione dell'elemento per calcolare il punteggio di pertinenza.
Incorporamenti
Multimodale: ricerca semantica multimodale sulle immagini degli articoli. Per maggiori dettagli, vedi Che cos'è la ricerca multimodale: gli "LLM con visione" cambiano le attività.
Testo (somiglianza semantica): ricerca semantica del testo su nomi e descrizioni degli articoli in base alla somiglianza semantica. Per saperne di più, consulta Vertex AI Embeddings for Text: Grounding LLMs made easy.
Testo (risposta alle domande): ricerca semantica del testo su nomi e descrizioni degli articoli, con una qualità di ricerca migliorata in base al tipo di attività QUESTION_ANSWERING. È adatto per tipi di applicazioni di domande e risposte. Per informazioni sugli incorporamenti dei tipi di attività, consulta Migliorare il caso d'uso dell'IA generativa con gli incorporamenti e i tipi di attività di Vertex AI.
Scarsa (ricerca ibrida): ricerca di parole chiave (basata su token) sui nomi e sulle descrizioni degli articoli, generata con l'algoritmo TF-IDF. Per saperne di più, vai a Informazioni sulla ricerca ibrida.
Set di dati
La demo interattiva include diversi set di dati su cui puoi eseguire query. I set di dati differiscono tra loro in base al modello di embedding, al supporto degli embedding sparsi, alle dimensioni degli embedding e al numero di elementi archiviati.
Set di dati | Modello di embedding | Modello di embedding sparso | Dimensioni di embedding | Conteggio elementi |
---|---|---|---|---|
Mercari Multimodal + Sparse embeddings | Embedding multimodale | TF-IDF (nome e descrizione dell'articolo) |
1408 | ~3 milioni |
Testo di Mercari (similarità semantica) + incorporamenti sparsi | text-embedding-005 ) (Tipo di attività: SEMANTIC_SIMILARITY) |
TF-IDF (nome e descrizione dell'articolo) |
768 | ~3 milioni |
Testo di Mercari (risposta alle domande) + embedding sparsi | text-embedding-005 ) (Tipo di attività: QUESTION_ANSWERING) |
TF-IDF (nome e descrizione dell'articolo) |
768 | ~3 milioni |
GBIF Flowers Multimodal + Sparse embeddings | Embedding multimodale | TF-IDF (nome e descrizione dell'articolo) |
1408 | ~3,3 milioni |
Incorporamenti multimodali di GBIF Animals | Embedding multimodale | N/D | 1408 | ~7 milioni |
Passaggi successivi
Ora che hai familiarizzato con la demo, puoi approfondire l'utilizzo di Ricerca vettoriale.
Guida rapida: utilizza un set di dati di esempio per creare ed eseguire il deployment di un indice in meno di 30 minuti.
Prima di iniziare: scopri cosa fare per preparare gli incorporamenti e decidi il tipo di endpoint su cui eseguire il deployment dell'indice.