IndexEndpoint 모니터링

Google에서는 IndexEndpoint를 모니터링할 수 있도록 두 가지 측정항목을 제공합니다.

  • aiplatform.googleapis.com/matching_engine/current_shards

    DeployedIndex의 샤드 수입니다. 데이터가 추가 및 삭제될 때 벡터 검색이 최적의 성능을 얻기 위해 색인을 다시 샤딩합니다. 이 측정항목은 배포된 색인의 현재 샤드 수를 나타냅니다.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    DeployedIndex에서 사용 중인 총 활성 복제본 서버 수입니다. 쿼리 볼륨과 일치하도록 벡터 검색은 색인을 배포할 때 지정된 최소 및 최대 복제본 설정에 따라 복제본 서버를 자동으로 늘리거나 줄입니다.

    색인에 여러 개의 샤드가 있는 경우 다른 수의 복제본 서버를 사용하여 각 샤드를 제공할 수 있습니다. 이 측정항목은 지정된 색인의 모든 샤드 간의 총 복제본 사본 수입니다.

다음 단계