Google fornisce due metriche per il monitoraggio di IndexEndpoint
:
aiplatform.googleapis.com/matching_engine/current_shards
Il numero di shard del campo
DeployedIndex
. Man mano che i dati vengono aggiunti ed eliminati, Vector Search esegue automaticamente il restringimento dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero attuale di shard dell'indice di cui è stato eseguito il deployment.aiplatform.googleapis.com/matching_engine/current_replicas
Il numero totale di server di replica attivi utilizzati da
DeployedIndex
. Per garantire la corrispondenza con il volume delle query, Vector Search attiva o disattiva automaticamente i server di replica in base alle impostazioni di replica minima e massima specificate durante il deployment dell'indice.Se l'indice ha più shard, ciascuno può essere pubblicato utilizzando un numero diverso di server di replica. Questa metrica è il numero totale di server di replica in tutti gli shard dell'indice specificato.
Passaggi successivi
- Scopri come eseguire query sugli indici per trovare i vicini più vicini.
- Scopri come selezionare, eseguire query e visualizzare queste metriche in Metrics Explorer.