Surveiller le point de terminaison d'index

Google fournit deux métriques pour surveiller IndexEndpoint :

aiplatform.googleapis.com/matching_engine/current_shards

Nombre de partitions de DeployedIndex. À mesure que des données sont ajoutées et supprimées, Vector Search repartitionne automatiquement l'index pour assurer des performances optimales. Cette métrique indique le nombre actuel de partitions de l'index déployé.
aiplatform.googleapis.com/matching_engine/current_replicas

Nombre total de serveurs d'instances dupliquées actifs utilisés par DeployedIndex. Pour mettre en correspondance le volume des requêtes, Vector Search active ou désactive automatiquement les serveurs d'instances répliquées en fonction des paramètres minimum et maximum d'instance répliquée, qui sont spécifiés lors du déploiement de l'index.

Si l'index comporte plusieurs segments, chaque segment peut être diffusé en utilisant un nombre différent de serveurs d'instances dupliquées. Cette métrique correspond au nombre total de serveurs d'instances dupliquées sur tous les segments de l'index donné.