Google fornisce due metriche per il monitoraggio del IndexEndpoint
:
aiplatform.googleapis.com/matching_engine/current_shards
Il numero di shard del
DeployedIndex
. Man mano che i dati vengono aggiunti ed eliminati, la ricerca vettoriale esegue automaticamente lo sharding dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero corrente di frammenti dell'indice di cui è stato eseguito il deployment.aiplatform.googleapis.com/matching_engine/current_replicas
Il numero totale di server replica attivi utilizzati da
DeployedIndex
. Per soddisfare il volume di query, la ricerca vettoriale aumenta o diminuisce automaticamente il numero di server replica in base alle impostazioni minime e massime delle repliche specificate durante il deployment dell'indice.Se l'indice ha più shard, ogni shard può essere pubblicato utilizzando un numero diverso di server replica. Questa metrica indica il numero totale di server replica in tutti gli shard dell'indice specificato.
Passaggi successivi
- Scopri come eseguire query sugli indici per trovare i relativi vicini più prossimi.
- Scopri come selezionare, eseguire query e visualizzare queste metriche in Metrics Explorer.