이 문서에서는 측정항목 기반 알림 정책의 이슈를 확인, 조사, 관리하는 방법을 설명합니다.
시작하기 전에
필요한 권한이 있는지 확인합니다.
-
Google Cloud 콘솔을 사용하여 이슈를 보는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.
-
Cloud 콘솔 이슈 모니터링 뷰어(
roles/monitoring.cloudConsoleIncidentViewer
) -
Stackdriver 계정 뷰어(
roles/stackdriver.accounts.viewer
)
역할 부여에 대한 자세한 내용은 액세스 관리를 참조하세요.
-
Cloud 콘솔 이슈 모니터링 뷰어(
-
Google Cloud 콘솔을 사용하여 이슈를 관리하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.
-
Cloud 콘솔 이슈 모니터링 편집자(
roles/monitoring.cloudConsoleIncidentEditor
) -
Stackdriver 계정 뷰어(
roles/stackdriver.accounts.viewer
)
역할 부여에 대한 자세한 내용은 액세스 관리를 참조하세요.
-
Cloud 콘솔 이슈 모니터링 편집자(
Cloud Monitoring 역할에 대한 자세한 내용은 Identity and Access Management로 액세스 제어를 참조하세요.
이슈 찾기
이슈 목록을 보려면 다음 안내를 따르세요.
-
Google Cloud 콘솔에서 notifications 알림 페이지로 이동합니다.
검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.
- 요약 창에는 미해결 이슈 수가 나열됩니다.
- 이슈 창에는 가장 최근 이슈가 표시됩니다. 종료된 이슈를 포함하여 테이블에 가장 최근 이슈를 나열하려면 종료된 이슈 표시를 클릭합니다.
선택사항: 특정 이슈의 세부정보를 보려면 목록에서 이슈를 선택합니다. 이슈 세부정보 페이지가 열립니다. 이 페이지에 대한 자세한 내용은 이 페이지의 이슈 조사 섹션을 참조하세요.
이전 이슈 찾기
알림 페이지의 이슈 창에는 가장 최근의 미해결 이슈가 표시됩니다. 이전 이슈를 찾으려면 다음 중 한 가지 방법을 사용합니다.
이슈 표의 항목에서 페이지를 이동하려면 arrow_back_ios 최신 또는arrow_forward_ios 이전을 클릭합니다.
이슈 페이지로 이동하려면 모든 이슈 보기를 클릭합니다. 이슈 페이지에서 다음 작업을 모두 수행할 수 있습니다.
이슈 필터링
필터 표시줄에 값을 입력하면 필터와 일치하는 이슈만 이슈 표에 나열됩니다. 여러 필터를 추가할 경우 모든 필터를 충족하는 이슈만 표시됩니다.
이슈 표를 필터링하려면 다음 안내를 따르세요.
이슈 페이지에서 filter_list 표 필터링을 클릭한 다음 필터 속성을 선택합니다. 필터 속성에는 다음 항목이 모두 포함됩니다.
- 이슈 상태
- 알림 정책 이름
- 이슈가 개설되거나 종료된 때
- 측정항목 유형
- 리소스 유형
보조 메뉴에서 값을 선택하거나 필터 표시줄에 값을 입력합니다.
예를 들어 측정항목 유형을 선택하고
usage_time
을 입력하면 보조 메뉴에 다음 옵션만 표시할 수 있습니다.agent.googleapis.com/cpu/usage_time compute.googleapis.com/guest/container/cpu/usage_time container.googleapis.com/container/cpu/usage_time
이슈 조사
조사할 이슈를 찾은 후 해당 이슈의 이슈 세부정보 페이지로 이동합니다. 세부정보를 보려면 알림 페이지 또는 이슈 페이지에서 이슈 표의 이슈 요약을 선택합니다.
또는 이슈에 대한 링크가 포함된 알림을 받은 경우 해당 링크를 사용하여 이슈 세부정보를 볼 수 있습니다.
이슈 세부정보 페이지는 다음 정보를 제공합니다.
다음과 같은 상태 정보:
- 이름: 이 이슈를 발생시킨 알림 정책의 이름입니다.
- 상태: 이슈의 상태(미해결, 확인됨, 종료)입니다.
- 심각도: 이슈의 심각도입니다.
- 심각도 없음
- 심각
- 오류
- 경고
- 기간: 이슈가 열려 있는 기간입니다.
이슈의 원인이 된 알림 정책에 대한 정보:
조건 창: 알림 정책에서 이슈를 일으킨 조건을 식별합니다.
메시지 창: 알림 정책의 조건 구성에 따른 원인에 대한 간략한 설명을 보여줍니다. 이 창은 항상 채워집니다.
문서 창: 알림 정책을 만들 때 제공한 알림에 대한 문서 템플릿을 보여줍니다. 이 정보에는 알림 정책에서 모니터링하는 항목에 대한 설명과 완화 방법이 포함되어 있습니다.
알림 정책을 만들 때 이 필드를 건너뛰었으면 이 창에 '구성된 문서 없음'이 보고됩니다.
- 라벨: 다음을 보고합니다.
이슈를 일으킨 시계열의 모니터링 리소스 및 측정항목의 라벨 및 값입니다. 이 정보는 이슈의 원인이 된 특정 모니터링 리소스를 식별하는 데 도움이 됩니다.
문서에서 측정항목 라벨의 변수를 사용할 때 Monitoring은 라벨 값이 숫자, 문자, 슬래시(
/
) 또는 등호(=
)로 시작되지 않으면 알림에서 라벨을 생략합니다.- 사용자 지정 라벨과 알림 정책에 정의한 값입니다. 이러한 라벨은 알림 정책 구성 및 식별을 위해 사용할 수 있습니다. 정책과 관련된 라벨이 정책 라벨 섹션에 나열되고 조건의 일부로 정의된 라벨이 측정항목 라벨 섹션에 나열됩니다. 메타데이터 라벨은 라벨에 따라 달라지는 필터 또는 그룹화가 있는 경우에만 표시됩니다. 자세한 내용은 라벨로 알림에 주석 추가를 참조하세요.
이슈 세부정보 페이지에서는 이슈를 조사하기 위한 도구도 제공합니다.
-
이슈 타임라인: 이슈의 두 가지 시각적 표현을 제공합니다.
- 타임라인에서 빨간색 막대는 이슈 시간을 나타내고, 막대의 길이와 위치는 이슈 기간을 나타냅니다.
- 차트에는 이슈의 원인이 된 알림 정책에서 사용하는 시계열 데이터와 기준점이 표시됩니다. 일부 시계열이 알림 정책 조건을 충족하면 이슈가 시작됩니다.
시간 축은 다음 2개의 라벨이 지정된 점으로 이슈 기간을 표시합니다. 시간 축에서 이러한 점의 위치는 이슈 타임라인과 함께 표시되는 차트의 데이터 범위를 결정합니다. 기본적으로 이슈의 시작과 종료 시점에 점 1개씩 배치되고 이슈가 여전히 미해결 상태인 경우 현재 시간에 점 1개가 배치됩니다.
이슈 타임라인과 차트에서 기간을 수정할 수 있습니다.
-
차트에 표시된 시간 범위를 변경하려면 시간 축을 따라 점 중 하나를 드래그합니다. 이 기법을 사용하면 이슈의 시작 또는 끝과 같은 특정 구간에 집중할 수 있습니다.
축의 점을 드래그하여 차트를 변경하면 시간 범위 메뉴에 커스텀 값이 설정되고 메뉴는 사용 중지됩니다. 시간 범위 메뉴를 사용 설정하려면 재설정을 클릭하세요.
- 타임라인에 표시된 시간 범위를 변경하려면 시간 범위 메뉴에서 범위를 선택합니다.
- 다른 문제 해결 도구 링크입니다. 프로젝트 및 알림 정책의 구성과 이슈 발생 기간에 따라 사용 가능한 링크가 결정됩니다.
- 알림 정책의 세부정보 페이지를 보려면 정책 보기를 클릭하세요.
- 알림 정책 정의를 수정하려면 정책 수정을 클릭합니다.
- 리소스의 성능 정보 대시보드로 이동하려면 리소스 세부정보 보기를 클릭합니다.
- 로그 탐색기에서 관련 로그 항목을 보려면 로그 보기를 클릭합니다. 자세한 내용은 로그 탐색기를 사용하여 로그 보기를 참조하세요.
- 차트의 데이터를 조사하려면 측정항목 탐색기에서 보기를 클릭합니다.
- 주석: 이슈 조사에서 얻은 발견, 결과, 제안, 또는 기타 의견의 로그를 제공합니다.
- 주석을 추가하려면 필드에 텍스트를 입력하고 의견 추가를 클릭하세요.
- 의견을 삭제하려면 취소를 클릭합니다.
이슈 관리
이슈 상태는 다음 중 하나입니다.
error 열기: 알림 정책의 조건 집합이 충족되거나 조건이 더 이상 충족되지 않음을 나타내는 데이터가 없습니다. 알림 정책에 여러 조건이 포함된 경우 조건의 조합 방식에 따라 이슈가 개설됩니다. 자세한 내용은 여러 조건이 포함된 정책을 참조하세요.
warning 확인됨: 이슈가 개설되었으며 수동으로 확인됨으로 표시되었습니다. 일반적으로 이 상태는 이슈가 조사 중임을 나타냅니다.
check_circle 종료됨: 시스템에서 조건 충족이 중단되었다고 관측되었거나, 사용자가 이슈를 닫았거나, 조건이 지속적으로 충족되는지에 대한 관찰 없이 7일이 경과했습니다.
예를 들어 오류 수가 0보다 많을 때 알림을 전송하는 알림 정책을 만드는 경우 오류가 없을 때 오류 수가 0개인지 확인해야 합니다. 알림 정책이 오류 없음 상태에서 null을 반환하거나 비어 있으면 오류가 중지된 시기를 나타내는 신호가 없습니다. 상황에 따라 Monitoring Query Language(MQL)는 측정된 값을 사용할 수 없을 때 사용할 기본값을 지정하는 기능을 지원합니다. 예를 보려면 비율 사용을 참고하세요.
이슈 확인하기
이슈의 원인을 조사하기 시작하면 이슈를 확인됨으로 표시하는 것이 좋습니다.
이슈를 확인됨으로 표시하려면 다음 단계를 따르세요.
- 알림 페이지의 이슈 창에서 모든 이슈 보기를 클릭합니다.
이슈 페이지에서 확인할 이슈를 찾은 후 다음 중 한 가지 방법을 사용합니다.
- more_vert 옵션 더보기를 클릭한 다음 확인을 선택합니다.
- 이슈의 세부정보 페이지를 열고 이슈 확인을 클릭합니다.
알림 정책이 반복 알림을 전송하도록 구성된 경우 이슈를 확인해도 알림이 중지되지 않습니다. 이를 중지하려면 다음 중 하나를 수행합니다.
- 알림 정책에 대한 일시중지를 만듭니다.
- 알림 정책을 사용 중지합니다.
알림 정책 일시중지
Monitoring이 특정 기간 동안 이슈를 만들고 알림을 전송하지 못하도록 방지하려면 관련 알림 정책을 일시중지하세요. 알림 정책을 일시중지하면 Monitoring은 알림 정책과 관련된 모든 이슈도 닫습니다.
보고 있는 이슈에 대한 일시중지를 만들려면 다음을 수행하세요.
Incident details(이슈 세부정보) 페이지에서 Snooze(일시중지)를 클릭합니다.
일시중지 기간을 선택합니다. 일시중지 기간을 선택하면 일시중지가 즉시 시작됩니다.
이슈 세부정보 페이지를 볼 때 일시중지를 클릭한 후 기간을 선택하여 관련 알림 정책에 대한 일시중지를 만들 수 있습니다. 일시중지가 즉시 시작됩니다. 또한 이슈 페이지에서 알림 정책을 일시중지할 수 있는데, 일시중지할 이슈를 찾아서 more_vert 옵션 더보기를 클릭한 다음 일시중지를 선택하면 됩니다. 문제 해결 프로세스 중에 추가 알림을 방지하기 위해 서비스 중단 중 알림 정책을 일시중지할 수 있습니다.
이슈 종료
Monitoring이 이슈를 닫도록 하거나 관찰 수신이 중지되면 이슈를 닫을 수 있습니다. 이슈를 닫고 조건이 충족되었음을 나타내는 데이터가 수신되면 새 이슈가 생성됩니다. 이슈를 닫아도 해당 동작은 동일한 조건에 대해 열려 있는 다른 모든 이슈를 닫지 않습니다. 알림 정책을 일시중지하면 일시중지가 시작될 때 미해결 이슈가 닫힙니다.
다음 중 하나라도 발생하면 Monitoring이 자동으로 이슈를 종료합니다.
측정항목 기준점 조건:
- 기준점이 위반되지 않았음을 나타내는 관찰이 수신됩니다.
관찰이 수신되지 않고 관찰 수신이 중지되고 기본 리소스 상태가 알 수 없음이거나 사용 중지됨이면 이슈를 닫도록 조건이 구성됩니다.
알림 정책의 자동 종료 기간 동안 관찰이 수신되지 않고 관찰 수신이 중지되면 이슈를 자동으로 닫도록 조건이 구성되지 않습니다. 자동 종료 기간을 구성하려면 Google Cloud 콘솔이나 Cloud Monitoring API를 사용하면 됩니다. 기본적으로 자동 종료 기간은 7일입니다. 최소 자동 종료 기간은 30분입니다.
측정항목 부재 조건:
- 관찰이 발생합니다.
- 알림 정책의 자동 종료 기간이 만료된 후 24시간 동안 관찰이 수신되지 않습니다. 자동 종료 기간을 구성하려면 Google Cloud 콘솔이나 Cloud Monitoring API를 사용하면 됩니다. 기본적으로 자동 종료 기간은 7일입니다.
예측 조건:
- 예측이 생성되고 시계열이 예측 기간 내 기준점을 위반하지 않을 것이라고 예측합니다.
10분 동안 관찰이 수신되지 않고 관찰 수신이 중지되고 기본 리소스 상태가 알 수 없음이거나 사용 중지됨이면 이슈를 닫도록 조건이 구성됩니다.
알림 정책의 자동 종료 기간 동안 관찰이 수신되지 않고 관찰 수신이 중지되면 이슈를 자동으로 닫도록 조건이 구성되지 않습니다.
예를 들어 HTTP 응답 지연 시간이 10분 연속으로 2초를 초과했기 때문에 알림 정책에서 이슈를 생성했습니다. HTTP 응답 지연 시간의 다음 측정값이 2초 이하인 경우 이슈가 종료됩니다. 마찬가지로 7일 동안 데이터가 전혀 수신되지 않으면 이슈가 종료됩니다.
이슈를 닫으려면 다음을 수행합니다.
- 알림 페이지의 이슈 창에서 모든 이슈 보기를 클릭합니다.
이슈 페이지에서 종료할 이슈를 찾은 후 다음 중 한 가지 방법을 사용합니다.
- more_vert 더 보기를 클릭한 후 이슈 닫기를 선택합니다.
- 이슈의 세부정보 페이지를 열고 이슈 종료를 클릭합니다.
Unable to close incident with active conditions
메시지가 표시되면 최근 알림 기간 내에 데이터가 수신되었기 때문에 이슈를 종료할 수 없는 것입니다.
Unable to close incident. Please try again in a few minutes.
메시지가 표시되면 내부 오류로 인해 이슈를 종료할 수 없습니다.
데이터 보관 및 한도
한도 및 이슈 보관 기간에 대한 자세한 내용은 알림 한도를 참조하세요.
다음 단계
- Cloud Monitoring API 또는 명령줄로 알림 정책을 만들고 관리하려면 API를 통한 알림 정책 관리를 참조하세요.