Google bietet zwei Messwerte für das Monitoring des IndexEndpoint
:
aiplatform.googleapis.com/matching_engine/current_shards
Die Anzahl der Fragmentierungen von
DeployedIndex
. Nachdem Daten hinzugefügt und gelöscht wurden, passt die Vektorsuche den Index automatisch neu an, um eine optimale Leistung zu erzielen. Dieser Messwert gibt die aktuelle Anzahl der Fragmentierungen des bereitgestellten Index an.aiplatform.googleapis.com/matching_engine/current_replicas
Die Gesamtzahl der aktiven Replikatserver, die vom
DeployedIndex
verwendet werden. Zum Bewältigung des Abfragevolumens aktiviert oder deaktiviert die Vektorsuche automatisch Replikatserver anhand der Mindest- und Höchstwerte der Replikateinstellungen, die bei der Bereitstellung des Index festgelegt wurden.Wenn der Index mehrere Shards enthält, kann jeder Shard mit einer anderen Anzahl von Replikatservern bereitgestellt werden. Dieser Messwert gibt die Gesamtzahl der Replikatserver für alle Shards des angegebenen Index an.
Nächste Schritte
- Informationen zum Abfragen der Indexe, um die nächsten Nachbarn zu finden
- Informationen zum Auswählen, Abfragen und Anzeigen dieser Messwerte in Metrics Explorer