Supervisa el IndexEndpoint

Google proporciona dos métricas para supervisar IndexEndpoint:

  • aiplatform.googleapis.com/matching_engine/current_shards

    La cantidad de fragmentos del DeployedIndex. A medida que se agregan y borran datos, la Búsqueda vectorial vuelve a fragmentar de forma automática el índice para lograr un rendimiento óptimo. Esta métrica indica la cantidad actual de fragmentos del índice implementado.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    La cantidad total de servidores de réplica activos que usa DeployedIndex. Para que el volumen de consultas coincida, Vector Search activa o reduce automáticamente los servidores de réplica según la configuración de réplica mínima y máxima especificada cuando se implementa el índice.

    Si el índice tiene varios fragmentos, cada fragmento se puede entregar mediante una cantidad diferente de servidores de réplica. Esta métrica es la cantidad total de servidores de réplica en todos los fragmentos del índice determinado.

¿Qué sigue?