监控 IndexEndpoint

Google 提供了两个用于监控 IndexEndpoint 的指标:

  • aiplatform.googleapis.com/matching_engine/current_shards

    DeployedIndex 的分片数。添加和删除数据后,Vector Search 会自动对索引进行重新分片,以实现最佳性能。此指标表示已部署索引的当前分片数。

  • aiplatform.googleapis.com/matching_engine/current_replicas

    DeployedIndex 使用的活跃副本服务器的总数。为了匹配查询量,Vector Search 会根据部署索引时指定的最小和最大副本设置自动开启或关闭副本服务器。

    如果索引有多个分片,则可以使用不同数量的副本服务器为每个分片提供服务。此指标是给定索引的所有分片中的副本服务器总数。

后续步骤