Google menyediakan dua metrik untuk memantau IndexEndpoint
:
aiplatform.googleapis.com/matching_engine/current_shards
Jumlah shard
DeployedIndex
. Saat data ditambahkan dan dihapus, Vector Search akan otomatis melakukan sharding ulang indeks untuk mencapai performa yang optimal. Metrik ini menunjukkan jumlah shard saat ini dari indeks yang di-deploy.aiplatform.googleapis.com/matching_engine/current_replicas
Jumlah total server replika aktif yang digunakan oleh
DeployedIndex
. Untuk mencocokkan volume kueri, Vector Search akan otomatis menaikkan atau menurunkan server replika berdasarkan setelan replika minimum dan maksimum yang ditentukan saat men-deploy indeks.Jika indeks memiliki beberapa shard, setiap shard dapat disajikan dengan menggunakan jumlah server replika yang berbeda. Metrik ini adalah jumlah total server replika di semua shard pada indeks tertentu.
Langkah selanjutnya
- Pelajari cara membuat kueri indeks untuk menemukan tetangga terdekatnya.
- Pelajari cara memilih, membuat kueri, dan menampilkan metrik ini di Metrics Explorer.