Google fournit deux métriques pour surveiller IndexEndpoint
:
aiplatform.googleapis.com/matching_engine/current_shards
Nombre de partitions de
DeployedIndex
. À mesure que des données sont ajoutées et supprimées, Vector Search repartitionne automatiquement l'index pour assurer des performances optimales. Cette métrique indique le nombre actuel de partitions de l'index déployé.aiplatform.googleapis.com/matching_engine/current_replicas
Nombre total de serveurs d'instances dupliquées actifs utilisés par
DeployedIndex
. Pour mettre en correspondance le volume des requêtes, Vector Search active ou désactive automatiquement les serveurs d'instances répliquées en fonction des paramètres minimum et maximum d'instance répliquée, qui sont spécifiés lors du déploiement de l'index.Si l'index comporte plusieurs segments, chaque segment peut être diffusé en utilisant un nombre différent de serveurs d'instances dupliquées. Cette métrique correspond au nombre total de serveurs d'instances dupliquées sur tous les segments de l'index donné.
Étapes suivantes
- Découvrez comment interroger vos index pour trouver les voisins les plus proches.
- Découvrez comment sélectionner, interroger et afficher ces métriques dans l'explorateur de métriques.