Métriques de l'index vectoriel

Cette page liste les métriques liées aux index vectoriels que vous générez dans AlloyDB Omni. Vous pouvez afficher ces métriques à l'aide de la vue pg_stat_ann_indexes disponible lorsque vous installez l'extension alloydb_scann.

Pour en savoir plus sur l'affichage des métriques, consultez Afficher les métriques de l'indice vectoriel.

Métriques d'usabilité

Les métriques d'usabilité incluent des métriques qui vous aident à comprendre l'état de l'utilisation de l'index avec des métriques telles que la configuration de l'index et le nombre d'analyses de l'index.

Nom de la métrique Type de données Description
relid OID Identifiant unique de la table contenant l'index vectoriel
indexrelid OID Identifiant unique de l'index vectoriel
schemaname NAME Nom du schéma propriétaire de l'index
relname NAME Nom de la table contenant l'index
indexrelname NAME Nom de l'index
indextype NAME Type d'index. Cette valeur est toujours définie sur alloydb_scann.
indexconfig TEXT[] Configuration, comme le nombre de feuilles et le quantizeur, définie pour l'index lors de sa création
indexsize TEXT Taille de l'index
indexscan BIGINT Nombre d'analyses d'index lancées sur l'index

Métriques de réglage

Les métriques de réglage fournissent des insights sur votre optimisation d'index actuelle. Vous pouvez ainsi appliquer des recommandations pour améliorer les performances des requêtes.

Nom de la métrique Type de données Description
insertcount BIGINT Nombre d'opérations d'insertion sur l'index. Cette métrique inclut également le nombre de lignes qui existaient avant la création de l'index.
updatecount BIGINT Nombre d'opérations de mise à jour sur l'index. Cette métrique ne tient pas compte des mises à jour HOT.
deletecount BIGINT Nombre d'opérations de suppression sur l'index.
distribution JSONB Distributions vectorielles sur toutes les partitions de l'index.

Les champs suivants indiquent la distribution:
  • maximum (INT8): nombre maximal de vecteurs pour toutes les partitions.
  • minimum (INT8): nombre minimal de vecteurs pour toutes les partitions.
  • average (FLOAT) : nombre moyen de vecteurs pour toutes les partitions.
  • outliers (INT8[]): valeurs aberrantes les plus élevées pour toutes les partitions. Cette valeur indique les 20 valeurs aberrantes les plus importantes.

Remarque:En raison des caractéristiques inhérentes de l'algorithme de clustering K-means, il existe toujours un certain degré de variance dans la distribution des vecteurs entre les partitions, même lors de la création initiale de l'index.

Recommandation de réglage basée sur les métriques

Mutation
Les métriques insertcount, updatecount et deletecount montrent ensemble les modifications ou les mutations du vecteur pour l'index.
L'index est créé avec un nombre spécifique de vecteurs et de partitions. Lorsque des opérations telles que l'insertion, la mise à jour ou la suppression sont effectuées sur l'index de vecteurs, elles n'affectent que l'ensemble initial de partitions dans lesquelles se trouvent les vecteurs. Par conséquent, le nombre de vecteurs dans chaque partition fluctue au fil du temps, ce qui peut avoir un impact sur le rappel, le RPS ou les deux.
Si vous rencontrez des problèmes de lenteur ou de précision, tels qu'un faible nombre de requêtes par seconde ou un faible rappel, dans vos requêtes de recherche avec ANN au fil du temps, envisagez de consulter ces métriques. Un nombre élevé de mutations par rapport au nombre total de vecteurs peut indiquer qu'un réindexage est nécessaire.
Distribution
La métrique distribution affiche les distributions vectorielles pour toutes les partitions.
Lorsque vous créez un indice, il est créé avec un nombre spécifique de vecteurs et de partitions fixes. Le processus de partitionnement et la distribution ultérieure se font en fonction de cette considération. Si des vecteurs supplémentaires sont ajoutés, ils sont répartis entre les partitions existantes, ce qui entraîne une distribution différente de celle obtenue lors de la création de l'index. Étant donné que la distribution finale ne prend pas en compte tous les vecteurs simultanément, le rappel, le nombre de requêtes par seconde ou les deux peuvent être affectés.
Si vous constatez une baisse progressive des performances de vos requêtes de recherche avec un ANN, comme des temps de réponse plus longs ou une précision réduite des résultats (mesurée par le RPS ou le rappel), envisagez de vérifier cette métrique et de réindexer votre site.