Monitorare un indice di cui è stato eseguito il deployment

Vertex AI fornisce due metriche per monitorare il IndexEndpoint di un indice di cui è stato eseguito il deployment:

aiplatform.googleapis.com/matching_engine/current_shards

Il numero di shard del DeployedIndex. Man mano che i dati vengono aggiunti ed eliminati, la ricerca vettoriale esegue automaticamente lo sharding dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero corrente di frammenti dell'indice di cui è stato eseguito il deployment.
aiplatform.googleapis.com/matching_engine/current_replicas

Il numero totale di server replica attivi utilizzati da DeployedIndex. Per soddisfare il volume di query, la ricerca vettoriale aumenta o diminuisce automaticamente il numero di server replica in base alle impostazioni minime e massime delle repliche specificate durante il deployment dell'indice.

Se l'indice ha più shard, ogni shard può essere pubblicato utilizzando un numero diverso di server replica. Questa metrica indica il numero totale di server replica in tutti gli shard dell'indice specificato.

Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.

Ultimo aggiornamento 2025-09-12 UTC.

Monitorare un indice di cui è stato eseguito il deployment Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.