Scegliere un indice di vettori in AlloyDB AI

Questa pagina descrive le strategie di ricerca di vettori IA di AlloyDB e spiega quando utilizzare ciascuna strategia. Per impostazione predefinita, AlloyDB utilizza la ricerca K-Nearest Neighbor (KNN) per trovare vettori simili a una query. Gli indici vettoriali implementano una strategia di ricerca chiamata Approximate Nearest Neighbor (ANN). Quando crei un indice vettoriale, AlloyDB AI utilizza le ANN, che offrono un rendimento migliore rispetto alle KNN. Tieni presente che, quando selezioni un indice di vettore, devi bilanciare la latenza delle query e il richiamo.

Il ricordo misura l'efficacia con cui una ricerca recupera tutti gli elementi pertinenti per una determinata query. Ad esempio, immagina di avere 100 embedding, ciascuno rappresentante un'entità nel tuo database. Esegui una query sui tuoi embedding con un vettore di destinazione e limitala a 10 risultati. Una ricerca vettoriale KNN trova i 10 vettori esatti più vicini utilizzando un metodo di calcolo alla cieca, che consente di ottenere un richiamo del 100%. AlloyDB AI utilizza questo metodo per impostazione predefinita se non viene creato o scelto un indice di ricerca vettoriale. Quando crei un indice vettoriale in AlloyDB per PostgreSQL, in genere viene utilizzata la rete neurale artificiale, che potrebbe suddividere i vettori in base alla somiglianza per facilitare il recupero più rapido. Di conseguenza, con l'utilizzo di ANN, i 10 vettori restituiti nell'esempio precedente potrebbero non essere esattamente i 10 vettori più vicini in distanza. Se solo 8 dei 10 vettori recuperati sono i più vicini nello spazio al vettore della query, il tuo recupero è dell'80%.

La latenza della query definisce la velocità con cui vengono generati i risultati di ricerca. Ad esempio, la latenza viene calcolata in base al tempo impiegato per una ricerca per restituire i vettori dopo l'invio di una query.

Scegli la tua strategia di ricerca

Quando esegui la ricerca vettoriale in AlloyDB, scegli una delle seguenti strategie di ricerca:

Strategia di ricerca Descrizione Casi d'uso
K-Nearest Neighbor (KNN) Un algoritmo che trova i punti dati dei k vicini più prossimi a un determinato punto dati della query. Quando esegui una ricerca di vettori senza creare un indice, per impostazione predefinita viene eseguita una ricerca KNN.
  • La tua applicazione è molto sensibile all'accuratezza e hai bisogno delle corrispondenze più precise.
  • Hai meno di 100.000 vettori.
Vicini più prossimi approssimativi (ANN) Un algoritmo che trova approssimativamente i punti dati più vicini. Le reti neurali artificiali suddividono i punti dati dei clienti esistenti in piccoli gruppi in base alle somiglianze.
  • La tua applicazione richiede una bassa latenza.
  • Hai più di 100.000 vettori.

Google consiglia di creare un indice di vettori per ottimizzare il rendimento delle query di ricerca di vettori. Per ulteriori informazioni su come viene utilizzato l'indice ANN per le ricerche di somiglianza, consulta Creare indici e vettori di query utilizzando ScaNN.

Passaggi successivi