IndexEndpoint überwachen

Google bietet zwei Messwerte für das Monitoring des IndexEndpoint:

  • aiplatform.googleapis.com/matching_engine/current_shards

    Die Anzahl der Fragmentierungen von DeployedIndex. Nachdem Daten hinzugefügt und gelöscht wurden, passt die Vektorsuche den Index automatisch neu an, um eine optimale Leistung zu erzielen. Dieser Messwert gibt die aktuelle Anzahl der Fragmentierungen des bereitgestellten Index an.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    Die Gesamtzahl der aktiven Replikatserver, die vom DeployedIndex verwendet werden. Zum Bewältigung des Abfragevolumens aktiviert oder deaktiviert die Vektorsuche automatisch Replikatserver anhand der Mindest- und Höchstwerte der Replikateinstellungen, die bei der Bereitstellung des Index festgelegt wurden.

    Wenn der Index mehrere Shards enthält, kann jeder Shard mit einer anderen Anzahl von Replikatservern bereitgestellt werden. Dieser Messwert gibt die Gesamtzahl der Replikatserver für alle Shards des angegebenen Index an.

Nächste Schritte