IndexEndpoint のモニタリング

Google では、IndexEndpoint をモニタリングするための指標を 2 つ用意しています。

  • aiplatform.googleapis.com/matching_engine/current_shards

    DeployedIndex のシャード数。データが追加または削除されると、ベクトル検索はインデックスを自動的に再シャーディングして最適なパフォーマンスを実現します。この指標は、デプロイされたインデックスの現在のシャード数を示します。

  • aiplatform.googleapis.com/matching_engine/current_replicas

    DeployedIndex で使用されているアクティブなレプリカ サーバーの合計数。ベクトル検索は、インデックスをデプロイする際にユーザーが指定した最小レプリカ数と最大レプリカ数に基づき、クエリの量に合わせてレプリカ サーバーの起動と終了を自動的に行います。

    インデックスに複数のシャードがある場合、シャードごとに異なる数のレプリカ サーバーを使用できることに注意してください。この指標は、特定のインデックスのシャードのすべてのレプリカ サーバーを合計した数です。

次のステップ