이 문서는 측정항목 데이터의 비율을 차트로 표시하거나 모니터링하는 최선의 방법을 선택하는 데 도움이 됩니다. 또한 예시 링크, 비율을 계산할 수 있는 조건, 서로 다른 두 가지 측정항목의 비율을 차트로 작성할 때 발생할 수 있는 문제점을 설명합니다. 이러한 문제점은 샘플링 레이트 또는 정렬 매개변수의 차이로 인해 발생합니다.
비율을 사용하면 측정항목 데이터를 더 유용한 다른 형태로 변환할 수 있습니다. 예를 들어 HTTP 응답을 응답 코드별로 계수하는 측정항목 유형을 가정해 보겠습니다. 측정항목 데이터는 오류 수를 보고하지만 실패한 요청의 비율은 보고하지 않습니다. 그러나 성능 요구사항은 종종 '오류율이 0.1% 미만이어야 함'과 같이 백분율로 지정되는 경우가 많습니다. 측정항목 데이터를 사용하여 오류율을 확인하려면 총 요청 수에 대해 실패한 요청의 비율을 계산합니다.
권장사항
측정항목 데이터의 비율을 모니터링하거나 차트로 표시하려면 PromQL을 사용하는 것이 좋습니다. Cloud Monitoring API 및 Google Cloud 콘솔에서 PromQL을 사용할 수 있습니다. Google Cloud 콘솔에는 유효한 PromQL 쿼리 작성을 위한 추천, 오류 감지 및 기타 지원 기능을 제공하는 코드 편집기가 포함되어 있습니다.
PromQL에 익숙하지 않을 때 측정항목 비율을 모니터링하는 알림 정책을 만들려면 Cloud Monitoring API를 사용하고 시계열 필터를 포함합니다. 관련 예시는 측정항목 비율을 참조하세요.
PromQL에 익숙하지 않은 경우 측정항목 데이터의 비율을 차트로 표시하려면 Google Cloud 콘솔을 사용하고 메뉴 기반 인터페이스를 사용하는 것이 좋습니다. 자세한 안내는 측정항목 비율을 차트로 표시 및 커스텀 대시보드에 차트 및 테이블 추가를 참조하세요.
비율 관련 제한사항
비율을 구성할 때 다음과 같은 제한사항이 적용됩니다.
집계 후 분모 시계열의 라벨은 분자 시계열의 라벨과 동일하거나 그 부분집합이어야 합니다.
집계 후에도 분자와 분모 시계열의 라벨이 동일하도록 집계 옵션을 선택하는 것이 좋습니다.
분자 시계열에
method
,quota_metric
,project_id
라벨이 있는 구성이 있다고 가정해 보겠습니다. 분모 시계열에는limit_name
,quota_metric
,project_id
라벨이 있습니다. 분모 그룹화에 유효한 선택은 분자의 선택에 따라 달라집니다.method
라벨로 분자 그룹화: 분모 시계열을 단일 시계열로 결합합니다. 다른 방식으로 그룹화하면 분자 시계열 라벨이 분모 시계열 라벨의 부분집합이 되지 않습니다.quota_metric
라벨로 분자 그룹화: 해당 라벨로 분모를 그룹화하거나 분모의 모든 시계열을 단일 시계열로 결합합니다.quota_metric
및project_id
라벨로 분자 그룹화: 두 라벨 또는 라벨 하나로 분모를 그룹화하거나 분모 시계열을 단일 시계열로 결합합니다.
분모 시계열에는
limit_name
라벨이 없으므로 유효한 분모 집계 옵션은 항상 그룹화된 시계열에서 해당 라벨을 제거합니다.Google Cloud 콘솔을 사용하여 차트를 구성할 때는 분자와 분모의 정렬 기간이 동일해야 하지만, Cloud Monitoring API를 사용할 때는 이러한 필드가 서로 다를 수 있습니다.
차트를 만드는 데 사용하는 도구에 관계없이 분자와 분모에 동일한 정렬 기간을 사용하는 것이 좋습니다.
분자와 분모의 값 유형은 동일해야 합니다. 예를 들어 분자가
DOUBLE
유형이면 분모도DOUBLE
유형이어야 합니다.비율을 사용하려면 분자와 분모의 측정항목 값 유형이
DOUBLE
또는INT64
여야 합니다.분자와 분모의 정렬된 시계열은 측정항목 종류가 동일해야 합니다. 두 측정항목의 종류가 서로 다르면 정렬기를 사용하여 동일한 종류로 변환해야 합니다.
구성에서 분자로
DELTA
측정항목을 선택하고 분모로GAUGE
측정항목을 선택했다고 가정해 보겠습니다. 이 경우 비율 정렬기인ALIGN_RATE
를 사용하여DELTA
측정항목을GAUGE
측정항목으로 변환합니다. 예시를 보려면 특정 한도의 비율 할당량 사용에 대한 비율 알림 정책을 참조하세요.PromQL로 정의되지 않은 비율의 경우 분자와 분모의 모니터링 리소스 유형이 동일해야 합니다.
예를 들어 분자 측정항목의 리소스가 Compute Engine 인스턴스이면 분모 측정항목의 리소스도 Compute Engine 인스턴스여야 합니다.
샘플링 및 정렬 불일치로 인한 문제점
일반적으로 라벨 값을 사용하여 단일 측정항목 유형에 대해 수집된 시계열을 기준으로 비율을 계산하는 것이 가장 좋습니다. 서로 다른 두 측정항목 유형에서 계산되는 비율에는 샘플링 기간 및 정렬 기간의 차이로 인한 문제점이 나타날 수 있습니다.
예를 들어 두 가지 측정항목 유형, RPC 총 개수와 RPC 오류 개수가 있고 총 RPC에 대한 오류 개수 RPC의 비율을 계산한다고 가정해 보겠습니다. 실패한 RPC는 두 측정항목 유형 모두의 시계열에 포함됩니다. 따라서 시계열을 정렬할 때 두 시계열 모두 동일한 정렬 간격으로 실패한 RPC가 표시되지 않을 수 있습니다. 이러한 차이는 다음과 같은 여러 이유로 발생할 수 있습니다.
- 동일한 이벤트를 기록하는 서로 다른 시계열이 두 개 있으므로 컬렉션을 구현하는 두 가지 기본 카운터 값이 있게 되고 원자적으로 업데이트되지 않습니다.
- 샘플링 레이트는 다를 수 있습니다. 시계열이 공통 기간으로 정렬되면 단일 이벤트에 대한 이벤트 수가 서로 다른 측정항목의 시계열에 가까운 정렬 간격으로 표시될 수 있습니다.
해당 정렬 간격의 값 수에 차이가 있으면 1/0 또는 2/1과 같은 무의미한 error/total
비율 값이 발생할 수 있습니다.
비율에 사용되는 숫자가 클수록 무의미한 값이 나올 가능성이 낮습니다. 샘플링 기간보다 긴 정렬 기간을 사용하거나 특정 라벨의 데이터를 그룹화하여 집계하면 더 큰 숫자를 사용할 수 있습니다. 이러한 기법은 특정 간격의 포인트 수에 미치는 작은 차이의 영향을 최소화합니다. 즉, 간격의 예상 포인트 수가 300인 경우보다 3일 경우 2점 차이가 더 중요합니다.
기본 제공 측정항목 유형을 사용하는 경우 필요한 값을 얻기 위해 측정항목 유형 전반에서 비율을 계산해야 할 수도 있습니다.
두 개의 서로 다른 측정항목에서 RPC에서 오류 상태를 반환하는 RPC와 같이 같은 항목을 계산할 수 있는 커스텀 측정항목을 설계하는 경우 각 측정항목이 한 번만 포함된 단일 측정항목을 사용하는 것이 좋습니다. 예를 들어 RPC를 계산 중이고 모든 RPC에 대한 실패한 RPC 비율을 추적한다고 가정해보세요. 이 문제를 해결하려면 RPC를 계산하도록 단일 측정항목 유형을 만들고 라벨을 사용해서 'OK' 상태를 포함해서 호출 상태를 기록합니다. 그런 다음 각 상태 값 오류 또는 'OK'가 해당 사례에 대한 단일 카운터를 업데이트하여 기록됩니다.
다음 단계
PromQL을 사용하여 알림 정책을 구성하는 방법에 대한 자세한 내용은 PromQL을 사용한 알림 정책을 참조하세요.
차트 만들기에 대한 자세한 내용은 다음 문서를 참조하세요.
- 임시 차트를 만들려면 측정항목 탐색기를 참조하세요.
- Google Cloud 콘솔을 사용하여 대시보드에 차트를 추가하려면 커스텀 대시보드에 차트 및 테이블 추가를 참조하세요.
- Cloud Monitoring API를 사용하여 차트를 관리하려면 API로 대시보드 만들기 및 관리를 참조하세요.