Monitorar o IndexEndpoint

O Google fornece duas métricas para monitorar IndexEndpoint:

  • aiplatform.googleapis.com/matching_engine/current_shards

    O número de fragmentos de DeployedIndex. À medida que os dados são adicionados e excluídos, a Pesquisa de vetor refragmenta automaticamente o índice para alcançar o desempenho ideal. Essa métrica indica o número atual de fragmentos do índice implantado.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    O número total de servidores de réplica ativos que estão sendo usados pelo DeployedIndex. Para corresponder ao volume de consultas, o Vector Search aumenta ou diminui automaticamente os servidores de réplica com base nas configurações mínima e máxima de réplica especificadas ao implantar o índice.

    Se o índice tiver vários fragmentos, cada um deles poderá ser veiculado usando um número diferente de servidores de réplica. Essa métrica é o número total de servidores de réplica em todos os fragmentos do índice especificado.

A seguir