Monitorize um índice implementado

A Vertex AI fornece duas métricas para monitorizar a IndexEndpoint de um índice implementado:

  • aiplatform.googleapis.com/matching_engine/current_shards

    O número de fragmentos do DeployedIndex. À medida que os dados são adicionados e eliminados, a pesquisa vetorial divide automaticamente o índice em várias partes para alcançar um desempenho ideal. Esta métrica indica o número atual de fragmentos do índice implementado.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    O número total de servidores de réplica ativos que estão a ser usados pelo DeployedIndex. Para corresponder ao volume de consultas, a pesquisa vetorial aumenta ou diminui automaticamente os servidores de réplica com base nas definições de réplica mínima e máxima especificadas quando implementa o índice.

    Se o índice tiver vários fragmentos, cada fragmento pode ser publicado através de um número diferente de servidores de réplica. Esta métrica é o número total de servidores de réplica em todos os fragmentos do índice fornecido.

O que se segue?