알림을 통해 클라우드 애플리케이션의 문제를 적시에 파악하여 문제를 신속하게 해결할 수 있습니다. Cloud Monitoring에서 알림 정책은 알림을 받을 상황과 방법을 설명합니다. 이 페이지에서는 알림 정책 개요를 제공합니다.
Cloud Monitoring에서 수집되는 측정항목 데이터를 추적하기 위해 사용되는 알림 정책을 측정항목 기준 알림 정책이라고 부릅니다. 알림 정책에 대한 대부분의 Cloud Monitoring 문서에서는 측정항목 기준 알림 정책을 사용한다고 가정합니다. 측정항목 기준 알림 정책을 설정하는 방법을 알아보려면 Compute Engine 빠른 시작을 시도하세요.
또한 특정 메시지가 로그에 표시될 때 이를 알려주는 로그 기준 알림 정책을 만들 수 있습니다. 이러한 정책은 측정항목을 기준으로 하지 않습니다. 이 콘텐츠는 로그 기준 알림 정책에 적용되지 않습니다. 로그 기준 알림 정책에 대한 자세한 내용은 로그 모니터링을 참조하세요.
알림 작동 방식
각 알림 정책은 다음을 지정합니다.
리소스 또는 리소스 그룹이 응답이 필요한 상태일 때 이를 설명하는 조건입니다. 예를 들어 다음과 같이 조건을 구성할 수 있습니다.
The HTTP response latency is higher than two seconds for at least five minutes.
이 예시에서 조건은 측정항목 HTTP 응답 지연 시간을 모니터링하고 5분 기간 동안 모든 지연 시간 측정이 2초를 초과하면 트리거됩니다.
조건에는 세 가지 유형이 있습니다.
- 측정항목의 값이 특정 기간 동안 임곗값보다 크거나 작을 때 측정항목 임곗값 조건이 트리거됩니다.
- 측정항목 부재 조건은 일정 기간 동안 측정이 없을 때 트리거됩니다.
- 예측 조건은 이전 데이터를 사용하여 측정의 미래 동작을 예측합니다. 이러한 조건은 시계열이 예측 기간 내 임곗값을 위반할 것이라는 예측이 있을 때 트리거됩니다.
알림 정책에는 조건이 최소 1개 이상 있어야 하지만 여러 조건을 포함하도록 정책을 구성할 수 있습니다.
조치가 필요할 때 알림을 받을 사람을 설명하는 알림 채널. 알림 정책에 여러 알림 채널을 포함할 수 있습니다. Cloud Monitoring은 일반적인 알림 채널 외에도 Cloud Mobile App 및 Pub/Sub를 지원합니다. 지원되는 채널의 전체 목록과 이러한 채널의 구성 방법은 알림 채널 만들기 및 관리를 참조하세요.
예를 들어
my-support-team@example.com
으로 이메일을 보내고#my-support-team
채널에 Slack 메시지를 게시하도록 알림 정책을 구성할 수 있습니다.알림에 포함할 문서. 문서 필드는 일반 텍스트, 마크다운, 변수를 지원합니다.
예를 들어 알림 정책에 다음 문서를 포함할 수 있습니다.
## HTTP latency responses This alert originated from the project ${project}, using the variable $${project}.
측정항목 기준 알림 정책이 구성된 후 Monitoring은 해당 정책의 조건을 지속적으로 모니터링합니다. 특정 기간에만 모니터링되도록 조건을 구성할 수는 없습니다.
알림 정책의 조건이 트리거되면 Monitoring이 이슈를 만들고 이슈 생성에 대한 알림을 보냅니다. 이 알림에는 이슈에 대한 요약 정보, 이슈를 조사할 수 있는 정책 세부정보 페이지에 대한 링크, 지정된 모든 문서가 포함될 수 있습니다.
이슈가 미해결이고 Monitoring에서 측정항목 기준 정책 조건이 더 이상 충족되지 않는다고 판단되면 Monitoring은 이슈를 자동으로 종료하고 종료에 대한 알림을 보냅니다.
예시
웹 애플리케이션을 실행하는 Compute Engine 가상 머신(VM) 인스턴스에 웹 애플리케이션을 배포합니다. HTTP 응답 지연 시간이 크게 변동될 것으로 예상되는 경우에는 상당 시간 동안 애플리케이션의 지연 시간이 높을 때 지원팀이 이에 대응하도록 해야 합니다.
애플리케이션의 지연 시간이 높을 때 지원팀에 알림이 표시되도록 하려면 다음 알림 정책을 만듭니다.
If the HTTP response latency is higher than two seconds for at least five minutes, then open an incident and send an email to your support team.
이 알림 정책에서 측정항목 임곗값 조건은 HTTP 응답 지연 시간을 모니터링합니다. 이 지연 시간이 5분 동안 2초를 초과하는 경우 조건이 트리거되고 이슈가 생성됩니다. 지연 시간이 일시적으로 증가해도 조건이 트리거되지 않거나 이슈가 생성되지 않습니다.
웹 애플리케이션의 인기가 많아지면서 응답 지연 시간이 2초 이상으로 늘어납니다. 이 경우 알림 정책은 다음과 같이 응답합니다.
HTTP 지연 시간 측정이 2초를 초과하면 Monitoring이 5분 타이머를 시작합니다.
다음 5분 동안 수신된 각 지연 시간 측정이 2초를 초과하면 타이머가 만료됩니다. 타이머가 만료되면 조건이 트리거되고 Monitoring이 이슈를 열고 지원팀에 이메일을 보냅니다.
지원팀이 이메일을 받고, Google Cloud 콘솔에 로그인하며 알림 수신을 확인합니다.
알림 이메일의 문서에 따라 지원팀은 지연 시간의 원인을 해결할 수 있습니다. 몇 분 내에 HTTP 응답 지연 시간이 2초 미만으로 떨어집니다.
Monitoring은 2초 미만의 HTTP 지연 시간 측정을 수신하면 이슈를 종료하고 지원팀에 이슈가 종료되었다는 알림을 전송합니다.
지연 시간이 2초 이상으로 증가하고 5분 동안 임곗값보다 높게 유지되면 새 이슈가 개설되고 알림이 전송됩니다.
알림 정책 추가 방법
Google Cloud 콘솔, Cloud Monitoring API, Google Cloud CLI를 사용하여 측정항목 기준 알림 정책을 Google Cloud 프로젝트에 추가할 수 있습니다.
Google Cloud Console을 사용할 때 권장 알림을 만들거나 Cloud Monitoring의 알림 페이지에서 시작하여 알림을 만들 수 있습니다.
일부 Google Cloud 제품에는 권장 알림을 사용할 수 있습니다. 이러한 알림에는 알림 채널 추가와 같은 최소한의 구성이 필요합니다. 예를 들어 Pub/Sub Lite 주제 페이지는 할당량 한도에 도달할 때 알림을 표시하도록 구성된 알림에 연결됩니다. 마찬가지로 Monitoring 내의 VM 인스턴스 페이지는 이러한 인스턴스의 메모리 활용률 및 네트워크 지연 시간을 모니터링하도록 구성된 알림 정책에 연결됩니다.
알림 정책을 만드는 방법은 다음 문서를 참조하세요.
Google Cloud 콘솔을 사용하여 만드는 모든 정책은 Google Cloud 콘솔 또는 Cloud Monitoring API를 사용하여 수정하고 볼 수도 있습니다. Cloud Monitoring API를 사용하면 측정항목의 비율을 모니터링하는 알림 정책을 만들 수 있습니다. 이러한 정책에 Monitoring 필터가 사용되는 경우에는 Google Cloud 콘솔을 사용해서 이를 보거나 수정할 수 없습니다.
Cloud Monitoring API를 직접 사용하거나 Google Cloud CLI를 사용하는 경우에는 알림 정책을 만들고, 보고, 수정할 수 있습니다.
자세한 내용은 Cloud Monitoring API 또는 Google Cloud CLI를 사용하여 알림 정책 만들기를 참조하세요.
단일 측정항목, 여러 측정항목 또는 측정항목의 비율을 모니터링하는 조건을 만들 수 있습니다. Cloud Monitoring API를 사용하는 경우 Monitoring Query Language(MQL) 또는 Monitoring 필터를 사용하여 비율을 지정할 수 있습니다. Monitoring 필터를 사용하는 정책 예시는 측정항목 비율을 참조하세요.
Cloud Monitoring은 Google Cloud 콘솔 및 Cloud Monitoring API와 함께 사용할 수 있는 표현적인 텍스트 기반 언어를 지원합니다. 알림에서 이 언어 사용에 대한 자세한 내용은 모니터링 쿼리 언어(MQL)를 사용하여 알림 정책 만들기를 참조하세요.
Cloud Logging의 로그 탐색기 또는 Monitoring API를 사용하여 Google Cloud 프로젝트에 로그 기준 알림 정책을 추가할 수 있습니다 이 콘텐츠는 로그 기준 알림 정책에 적용되지 않습니다. 로그 기준 알림 정책에 대한 자세한 내용은 로그 모니터링을 참조하세요.
알림 정책과 관련된 비용
알림 정책 사용과 관련된 비용은 없습니다. 업타임 체크 가격 책정에 대한 자세한 내용은 Cloud Monitoring 가격 책정 요약을 참조하세요.
알림 정책과 업타임 체크 사용에는 다음 한도가 적용됩니다.
카테고리 | 값 | 정책 유형1 |
---|---|---|
측정항목 범위별 알림 정책(측정항목 및 로그 합계)2 | 500 | 측정항목, 로그 |
알림 정책당 조건 | 6 | 측정항목 |
측정항목 부재 조건이 평가하는 최대 기간3 |
1일 | 측정항목 |
측정항목 임계값 조건이 평가하는 최대 기간3 |
23시간 30분 | 측정항목 |
측정항목 기준 조건에서 사용된 필터의 최대 길이 |
2,048개의 유니코드 문자 | 측정항목 |
예측 조건으로 모니터링되는 최대 시계열 수 |
64 | 측정항목 |
최소 예측 기간 | 1시간(3,600초) | 측정항목 |
최대 예측 기간 | 7일(604,800초) | 측정항목 |
알림 정책당 알림 채널 | 16 | 측정항목, 로그 |
최대 알림 속도 | 각 로그 기준 알림에 대해 5분당 1개 알림 | 로그 |
최대 알림 수 | 각 로그 기준 알림에 대해 1일당 20개 알림 | 로그 |
알림 정책별 동시 개설된 이슈의 최대 개수 |
1,000 | 측정항목 |
새 데이터가 없는 이슈가 자동으로 닫히는 기간 |
7일 | 측정항목 |
수동으로 닫히지 않은 경우의 이슈의 최대 기간 | 7일 | 로그 |
종료된 이슈 보관 | 13개월 | 해당 없음 |
미해결 이슈 보관 | 무제한 | 해당 없음 |
측정항목 범위당 알림 채널 | 4,000 | 해당 없음 |
다시 알림당 최대 알림 정책 수 | 16 | 측정항목, 로그 |
다시 알림 보류 | 13개월 | 해당 없음 |
측정항목 범위당 업타임 체크4 | 100 | 해당 없음 |
공개 업타임 체크당 최대 ICMP 핑 수 | 3 | 해당 없음 |
2Apigee 및 Apigee hybrid는 Cloud Monitoring과 긴밀하게 통합되어 있습니다. Standard, Enterprise, Enterprise Plus 등 모든 Apigee 구독 수준의 알림 한도는 Cloud Monitoring의 경우와 같습니다(측정항목 범위당 500개).
3조건이 평가되는 최대 기간은 정렬 기간과 기간 값의 합계입니다. 예를 들어 정렬 기간이 15시간으로 설정되고 기간이 15시간으로 설정된 경우 조건을 평가하려면 30시간의 데이터가 필요합니다.
4이 한도는 업타임 체크 구성의 수에 적용됩니다. 각 업타임 체크 구성은 지정된 리소스 상태 테스트 사이의 시간 간격을 포함합니다. 자세한 내용은 업타임 체크 관리를 참조하세요.
전체 가격 책정 정보는 Google Cloud 운영 제품군 가격 책정을 참조하세요.
다음 단계
알림 지연 시간에 대한 정보와 선택한 알림 정책 매개변수가 알림 전송 시기에 미치는 영향은 측정항목 기반 알림 정책 동작을 참조하세요.
측정항목 기반 정책 예시 목록은 예시 알림 정책 요약을 참조하세요.
수집되는 trace 스팬 또는 로그 수를 모니터링하는 방법 또는 특정 콘텐츠가 로그 항목에 포함되었을 때 알림을 받는 방법은 다음을 참조하세요.