지원되는 모니터링 측정항목

이 페이지에서는 Memorystore for Valkey에 사용할 수 있는 Cloud Monitoring 측정항목을 나열하고 각 측정항목이 측정하는 대상을 설명합니다.

Cloud Monitoring 측정항목

측정항목 이름 설명
memorystore.googleapis.com/instance/clients/average_connected_clients 인스턴스의 모든 노드에 대한 현재 평균 클라이언트 연결 수입니다.
memorystore.googleapis.com/instance/clients/maximum_connected_clients 인스턴스의 단일 노드에 대한 현재 최대 클라이언트 연결 수입니다.
memorystore.googleapis.com/instance/clients/maximum_connection_duration 인스턴스의 단일 노드에 대한 클라이언트 연결의 최대 기간입니다.
memorystore.googleapis.com/instance/clients/total_connected_clients 인스턴스에 대한 현재 클라이언트 연결 수입니다.
memorystore.googleapis.com/instance/stats/total_connections_received_count 지난 1분 동안 생성된 인스턴스 수준의 총 클라이언트 연결 수입니다.
memorystore.googleapis.com/instance/stats/total_rejected_connections_count 최대 클라이언트 한도로 인해 거부된 연결 수입니다.
memorystore.googleapis.com/instance/commandstats/total_usec_count 명령어당 소비된 총 시간입니다.
memorystore.googleapis.com/instance/commandstats/total_calls_count 1분 동안 이 명령어의 총 호출 수입니다.
memorystore.googleapis.com/instance/cpu/average_utilization 인스턴스의 모든 노드에 대한 최대 CPU 사용률입니다(0.0~1.0).
memorystore.googleapis.com/instance/cpu/maximum_utilization 인스턴스의 단일 노드에 대한 최대 CPU 사용률입니다(0.0~1.0).
memorystore.googleapis.com/instance/stats/average_expired_keys 인스턴스의 모든 노드의 기본에 대한 평균 키 만료 이벤트 수입니다.
memorystore.googleapis.com/instance/stats/maximum_expired_keys 기본의 인스턴스의 단일 노드에 대한 최대 키 만료 이벤트 수입니다.
memorystore.googleapis.com/instance/stats/total_expired_keys_count 인스턴스의 모든 노드의 기본에서 총 키 만료 이벤트 수입니다.
memorystore.googleapis.com/instance/stats/average_evicted_keys 인스턴스의 모든 노드의 기본에서 메모리 용량으로 인해 제거된 평균 키 수입니다.
memorystore.googleapis.com/instance/stats/maximum_evicted_keys 기본의 메모리 용량으로 인해 인스턴스의 단일 노드에서 제거된 최대 키 수입니다.
memorystore.googleapis.com/instance/stats/total_evicted_keys_count 인스턴스의 모든 노드의 기본에서 메모리 용량으로 인해 제거된 키 수입니다.
memorystore.googleapis.com/instance/keyspace/total_keys 인스턴스에 저장된 키 수입니다.
memorystore.googleapis.com/instance/stats/average_keyspace_hits 인스턴스의 모든 노드에 대한 성공한 평균 키 조회 수입니다.
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits 인스턴스의 단일 노드에 대한 성공한 최대 키 조회 수입니다.
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count 인스턴스에 대한 성공한 키 조회 수입니다.
memorystore.googleapis.com/instance/stats/average_keyspace_misses 인스턴스의 모든 노드에 대한 실패한 평균 키 조회 수입니다.
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses 인스턴스의 단일 노드에 대한 실패한 최대 키 조회 수입니다.
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count 인스턴스에 대한 실패한 키 조회 수입니다.
memorystore.googleapis.com/instance/memory/average_utilization 인스턴스의 모든 노드의 평균 메모리 사용률입니다. 값은 0.0~1.0까지입니다.
memorystore.googleapis.com/instance/memory/maximum_utilization 인스턴스의 단일 노드에 대한 최대 메모리 사용률입니다(0.0~1.0).
memorystore.googleapis.com/instance/memory/total_used_memory 인스턴스의 총 메모리 사용량입니다.
memorystore.googleapis.com/instance/memory/size 인스턴스의 메모리 크기입니다.
memorystore.googleapis.com/instance/replication/average_ack_lag 인스턴스의 모든 노드의 복제본에 대한 평균 복제 지연(초)입니다.

복제 지연(초)은 복제본이 기본보다 얼마나 지연되는지를 나타냅니다.
memorystore.googleapis.com/instance/replication/maximum_ack_lag 인스턴스의 단일 복제본에 대한 최대 복제 확인 지연 (초)입니다.

복제 확인 지연 (초)은 복제 확인이 기본보다 얼마나 지연되는지를 나타냅니다.
memorystore.googleapis.com/instance/replication/average_offset_diff 인스턴스의 모든 노드에 대한 평균 복제 확인 오프셋 차이(바이트)입니다.

복제 확인 오프셋 차이는 복제본과 기본 간에 복제되지 않은 바이트 수를 의미합니다.
memorystore.googleapis.com/instance/replication/maximum_offset_diff 인스턴스의 단일 노드에 대한 최대 복제 오프셋 차이(바이트)입니다.

복제 오프셋 차이는 복제본과 기본 간에 복제되지 않은 바이트 수를 의미합니다.
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count 인스턴스 엔드포인트에서 수신된 수신 네트워크 바이트 수입니다.
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count 인스턴스 엔드포인트에서 전송된 발신 네트워크 바이트 수입니다.

지속성 측정항목

이 섹션에서는 지속성 측정항목을 나열하고 지속성 측정항목의 샘플 사용 사례를 제공합니다.

RDB 지속성 측정항목

측정항목 이름 설명
memorystore.googleapis.com/instance/persistence/load_count 인스턴스 전체(AOF 또는 RDB)에서 dumpfile의 누적 로드 수입니다.
memorystore.googleapis.com/instance/persistence/rdb_saves_count 이 측정항목은 인스턴스가 RDB 스냅샷을 생성한 누적 횟수를 보여줍니다(저장이라고도 함). 이 측정항목에는 status_code 필드가 있습니다. 스냅샷이 실패했는지 확인하려면 status_code 필드를 3 - INTERNAL_ERROR 오류로 필터링하면 됩니다.
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages 이 측정항목은 인스턴스의 모든 노드에 대한 분포 스냅샷 수명을 보여줍니다. 분포에 스냅샷 빈도보다 지연 시간이 짧거나 동일한 값이 있는 것이 좋습니다.
memorystore.googleapis.com/instance/persistence/rejected_writes_count 지속 실패로 인해 인스턴스에서 거부된 쓰기 명령어의 누적 수입니다.

AOF 지속성 측정항목

측정항목 이름 설명
memorystore.googleapis.com/instance/persistence/aof_fsync_lags 이 측정항목은 인스턴스의 모든 노드에 대한 지연(데이터 쓰기부터 내구성 있는 스토리지 동기화)의 분포를 보여줍니다. appendfsync=everysec인 인스턴스에만 내보냅니다. 분포에 AOF 동기화 빈도보다 지연 시간이 짧거나 동일한 값이 있는 것이 좋습니다.
memorystore.googleapis.com/instance/persistence/aof_rewrite_count 이 측정항목은 노드가 AOF 재작성을 트리거한 인스턴스의 누적 횟수를 보여줍니다. 이 측정항목에는 status_code 필드가 있습니다. AOF 재작성이 실패하는지 확인하려면 status_code 필드를 3 - INTERNAL_ERROR 오류로 필터링하면 됩니다.

지속성 측정항목의 샘플 사용 사례

AOF 쓰기 작업으로 인해 지연 시간 및 메모리 압력이 발생하는지 확인

인스턴스에서 지연 시간 또는 메모리 사용량 증가가 감지되었다고 가정해 보겠습니다. 이 경우 추가 사용량이 AOF 지속성과 관련이 있는지 확인해야 할 수 있습니다.

AOF 재작성 작업이 일시적인 로드 급증을 트리거할 수 있으므로 인스턴스의 수명 기간 동안 AOF 재작성의 누적 수를 제공하는 aof_rewrites_count 측정항목을 검사할 수 있습니다. 이 측정항목에서 재작성 횟수의 증가가 지연 시간 증가에 해당한다고 가정해 보겠습니다. 이 경우 쓰기 속도를 줄이거나 샤드 수를 늘려 재작성할 빈도를 줄임으로써 문제를 해결할 수 있습니다.

RDB 저장 작업으로 인해 지연 시간 및 메모리 압력이 발생하는지 확인

인스턴스에서 지연 시간 또는 메모리 사용량 증가가 감지되었다고 가정해 보겠습니다. 이 경우 추가 사용량이 RDB 지속성과 관련이 있는지 확인해야 할 수 있습니다.

RDB 저장 작업이 일시적인 로드 급증을 트리거할 수 있으므로 인스턴스의 수명 기간 동안 RDB 저장의 누적 수를 제공하는 rdb_saves_count 측정항목을 검사할 수 있습니다. 이 측정항목에서 RDB 저장 횟수의 증가가 지연 시간 증가에 해당한다고 가정해 보겠습니다. 이 경우 RDB 스냅샷 간격을 줄여서 재작성 빈도를 줄일 수 있습니다. 인스턴스를 수평 확장하여 기준 부하 수준을 줄일 수도 있습니다.

Memorystore for Valkey의 측정항목 해석

위 목록에 표시된 것처럼 대부분의 측정항목은 평균, 최대, 총계와 같은 3가지 카테고리를 공유합니다.

Memorystore for Valkey클러스터의 경우 동일한 측정항목의 평균최대 변형이 제공되므로 해당 측정항목 계열의 부하 집중을 식별하는 데 둘 다 사용할 수 있습니다.

측정항목의 총계 값은 독립적이며 평균최대의 부하 집중 목적과 관련되지 않은 별도의 통계를 제공합니다.

평균 및 최대 측정항목 이해하기

인스턴스의 average_keyspace_hitsmaximum_keyspace_hits 값을 비교한다고 가정해 보겠습니다. 두 측정항목의 차이가 커질수록 인스턴스 내 적중 항목의 집중 부하가 커집니다. 적중 항목이 인스턴스에 더 균일하게 분산되므로 average_keyspace_hitsmaximum_keyspace_hits 간의 값이 가까운 것이 이상적입니다.

이 원칙은 동일한 측정항목의 평균최대 변형이 있는 모든 측정항목에 적용됩니다.

핫스팟 예시

인스턴스의 모든 샤드에 대해 average_keyspace_hitsmaximum_keyspace_hits 값을 비교하면 핫스팟이 발생하는 위치를 알 수 있습니다. 예를 들어 샤드 6개가 있는 인스턴스의 샤드의 적중 횟수가 다음과 같다고 가정해 보겠습니다.

  • 샤드 1 – 2회 적중
  • 샤드 2 – 2회 적중
  • 샤드 3 – 2회 적중
  • 샤드 4 – 2회 적중
  • 샤드 5 – 2회 적중
  • 샤드 6 – 8회 적중

이 예시에서 average_keyspace_hits는 값 3을 반환하고 maximum_keyspace_hits는 8을 반환하여 샤드 6에 부하가 집중된다는 것을 알 수 있습니다.