Monitora l'endpoint indice

Google fornisce due metriche per il monitoraggio del IndexEndpoint:

  • aiplatform.googleapis.com/matching_engine/current_shards

    Il numero di shard del DeployedIndex. Man mano che i dati vengono aggiunti ed eliminati, la ricerca vettoriale esegue automaticamente lo sharding dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero corrente di frammenti dell'indice di cui è stato eseguito il deployment.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    Il numero totale di server replica attivi utilizzati da DeployedIndex. Per soddisfare il volume di query, la ricerca vettoriale aumenta o diminuisce automaticamente il numero di server replica in base alle impostazioni minime e massime delle repliche specificate durante il deployment dell'indice.

    Se l'indice ha più shard, ogni shard può essere pubblicato utilizzando un numero diverso di server replica. Questa metrica indica il numero totale di server replica in tutti gli shard dell'indice specificato.

Passaggi successivi