A Vertex AI fornece duas métricas para monitorizar a IndexEndpoint
de um índice implementado:
aiplatform.googleapis.com/matching_engine/current_shards
O número de fragmentos do
DeployedIndex
. À medida que os dados são adicionados e eliminados, a pesquisa vetorial divide automaticamente o índice em várias partes para alcançar um desempenho ideal. Esta métrica indica o número atual de fragmentos do índice implementado.aiplatform.googleapis.com/matching_engine/current_replicas
O número total de servidores de réplica ativos que estão a ser usados pelo
DeployedIndex
. Para corresponder ao volume de consultas, a pesquisa vetorial aumenta ou diminui automaticamente os servidores de réplica com base nas definições de réplica mínima e máxima especificadas quando implementa o índice.Se o índice tiver vários fragmentos, cada fragmento pode ser publicado através de um número diferente de servidores de réplica. Esta métrica é o número total de servidores de réplica em todos os fragmentos do índice fornecido.
O que se segue?
- Saiba como consultar os seus índices para encontrar os vizinhos mais próximos.
- Saiba como selecionar, consultar e apresentar estas métricas no explorador de métricas.