Choisir un index vectoriel dans AlloyDB AI

Cette page décrit les stratégies de recherche vectorielle AI d'AlloyDB et explique quand utiliser chacune d'elles. Par défaut, AlloyDB utilise la recherche des k plus proches voisins (KNN) pour trouver des vecteurs similaires à une requête. Les index vectoriels implémentent une stratégie de recherche appelée "voisin le plus proche approximatif" (ANN). Lorsque vous créez un indice vectoriel, l'IA AlloyDB utilise une ANN, qui offre de meilleures performances que KNN. N'oubliez pas que, lorsque vous sélectionnez un indice vectoriel, vous devez équilibrer la latence des requêtes et le rappel.

Le rappel mesure l'efficacité avec laquelle une recherche récupère tous les éléments pertinents pour une requête donnée. Par exemple, imaginons que vous disposiez de 100 embeddings, chacun représentant une entité dans votre base de données. Vous interrogez vos embeddings avec un vecteur cible et le limitez à 10 résultats. Une recherche vectorielle KNN trouve les 10 vecteurs les plus proches à l'aide d'une méthode de calcul par force brute, ce qui donne un rappel de 100 %. AlloyDB AI utilise cette méthode par défaut si aucun indice de recherche vectorielle n'est créé ni choisi. Lorsque vous créez un indice vectoriel dans AlloyDB pour PostgreSQL, il utilise généralement des réseaux de neurones artificiels, qui peuvent partitionner les vecteurs en fonction de leur similarité pour faciliter la récupération. Par conséquent, avec une ANN, les 10 vecteurs renvoyés dans l'exemple précédent ne sont peut-être pas exactement les 10 vecteurs les plus proches. Si seuls huit des 10 vecteurs récupérés sont les plus proches de votre vecteur de requête dans l'espace, votre rappel est de 80%.

La latence des requêtes définit la vitesse à laquelle les résultats de recherche sont générés. Par exemple, la latence est calculée en fonction du temps passé sur une recherche pour renvoyer les vecteurs après l'envoi d'une requête.

Choisir votre stratégie de recherche

Lorsque vous effectuez une recherche vectorielle dans AlloyDB, choisissez l'une des stratégies de recherche suivantes:

Stratégie de recherche Description Cas d'utilisation
K plus proches voisins (KNN) Algorithme qui trouve les k points de données les plus proches d'un point de données de requête donné. Lorsque vous effectuez une recherche vectorielle sans créer d'index, une recherche KNN est effectuée par défaut.
  • Votre application est très sensible à la précision et vous avez besoin des correspondances les plus proches possibles.
  • vous avez moins de 100 000 vecteurs ;
Voisin le plus proche (ANN) Algorithme qui recherche les points de données les plus proches. Les réseaux de neurones artificiels divisent les points de données client existants en petits groupes en fonction de leurs similitudes.
  • Votre application nécessite une faible latence.
  • Vous avez plus de 100 000 vecteurs.

Google vous recommande de créer un indice vectoriel pour optimiser les performances de vos requêtes de recherche vectorielle. Pour en savoir plus sur l'utilisation de l'index ANN pour les recherches de similarité, consultez Créer des index et des vecteurs de requête à l'aide de ScaNN.

Étape suivante