Google proporciona dos métricas para supervisar IndexEndpoint
:
aiplatform.googleapis.com/matching_engine/current_shards
La cantidad de fragmentos del
DeployedIndex
. A medida que se agregan y borran datos, la Búsqueda vectorial vuelve a fragmentar de forma automática el índice para lograr un rendimiento óptimo. Esta métrica indica la cantidad actual de fragmentos del índice implementado.aiplatform.googleapis.com/matching_engine/current_replicas
La cantidad total de servidores de réplica activos que usa
DeployedIndex
. Para que el volumen de consultas coincida, Vector Search activa o reduce automáticamente los servidores de réplica según la configuración de réplica mínima y máxima especificada cuando se implementa el índice.Si el índice tiene varios fragmentos, cada fragmento se puede entregar mediante una cantidad diferente de servidores de réplica. Esta métrica es la cantidad total de servidores de réplica en todos los fragmentos del índice determinado.
¿Qué sigue?
- Obtén información sobre cómo consultar tus índices para encontrar sus vecinos más cercanos.
- Obtén más información sobre cómo seleccionar, consultar y mostrar estas métricas en el Explorador de métricas.