Monitoraggio IndexEndpoint

Google fornisce due metriche per il monitoraggio di IndexEndpoint:

  • aiplatform.googleapis.com/matching_engine/current_shards

    Il numero di shard del campo DeployedIndex. Man mano che i dati vengono aggiunti ed eliminati, Vector Search esegue automaticamente il restringimento dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero attuale di shard dell'indice di cui è stato eseguito il deployment.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    Il numero totale di server di replica attivi utilizzati da DeployedIndex. Per garantire la corrispondenza con il volume delle query, Vector Search attiva o disattiva automaticamente i server di replica in base alle impostazioni di replica minima e massima specificate durante il deployment dell'indice.

    Se l'indice ha più shard, ciascuno può essere pubblicato utilizzando un numero diverso di server di replica. Questa metrica è il numero totale di server di replica in tutti gli shard dell'indice specificato.

Passaggi successivi