알림 소개

알림을 통해 클라우드 애플리케이션의 문제를 적시에 파악하여 문제를 신속하게 해결할 수 있습니다.

Cloud Monitoring에서 알림 정책은 알림을 받을 상황과 방법을 설명합니다. 이 페이지에서는 알림 정책 개요를 제공합니다.

알림 정책을 설정하는 방법은 Compute Engine 빠른 시작을 사용해 보세요.

알림 작동 방식

각 알림 정책은 다음을 지정합니다.

  • 리소스 또는 리소스 그룹이 조치를 취해야 하는 상태인 경우를 설명하는 조건. 알림 정책에는 조건이 최소 1개 이상 있어야 하지만 여러 조건을 포함하도록 정책을 구성할 수 있습니다.

    예를 들어 다음과 같이 조건을 구성할 수 있습니다.

    The HTTP response latency is higher than two seconds for at least five minutes.
    

    이 예시에서 조건은 측정항목 HTTP 응답 지연 시간을 모니터링하고 측정항목 값에 대해 조치를 취해야 하는 경우를 지정합니다.

  • 조치가 필요할 때 알림을 받을 사람을 설명하는 알림 채널. 알림 정책에 여러 알림 채널을 포함할 수 있습니다. Cloud Monitoring은 Cloud Mobile App 및 Pub/Sub 뿐만 아니라 일반적인 알림 채널을 지원합니다. 지원되는 채널의 전체 목록과 이러한 채널을 구성하는 방법에 대한 자세한 내용은 알림 옵션을 참조하세요.

    예를 들어 my-support-team@example.com으로 이메일을 보내고 #my-support-team 채널에 Slack 메시지를 게시하도록 알림 정책을 구성할 수 있습니다.

  • 알림에 포함할 문서. 문서 필드는 일반 텍스트, 마크다운, 변수 를 지원합니다.

    예를 들어 알림 정책에 다음 문서를 포함할 수 있습니다.

    ## HTTP latency responses
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

알림 정책이 구성된 후 Monitoring은 해당 정책의 조건을 지속적으로 모니터링합니다. 특정 기간에만 모니터링되도록 조건을 구성할 수는 없습니다. 이 정책의 조건이 충족되면, 즉 리소스 상태에 조치를 취해야 하는 경우 Monitoring은 이슈를 만들고 이슈 생성에 대한 알림을 보냅니다. 이 알림에는 이슈에 대한 요약 정보, 이슈를 조사할 수 있는 정책 세부정보 페이지에 대한 링크, 지정된 모든 문서가 포함될 수 있습니다.

이슈가 미해결이고 Monitoring에서 정책 조건이 더 이상 충족되지 않는다고 판단되면 Monitoring은 이슈를 자동으로 종료하고 종료에 대한 알림을 보냅니다.

예시

웹 애플리케이션을 실행하는 Compute Engine 가상 머신(VM) 인스턴스에 웹 애플리케이션을 배포합니다. HTTP 응답 지연 시간은 일반적인 수요가 증가하거나 감소함에 따라 변동될 수 있지만 사용자가 상당한 시간 동안 높은 지연 시간을 경험하면 지원팀이 조치를 취할 수 있도록 알림을 받아야 합니다.

사용자가 긴 지연 시간을 경험할 경우 알림을 받으려면 다음 알림 정책을 만드세요.

  If the HTTP response latency is higher than two seconds for at least five minutes,
  then open an incident and send an email to your support team.

이 알림 정책에서 조건은 HTTP 응답 지연 시간을 모니터링합니다. 이 지연 시간이 5분 동안 2초를 초과하는 경우 조건이 충족되고 이슈가 생성됩니다. 지연 시간이 일시적으로 증가해도 조건이 충족되지 않거나 이슈가 생성되지 않습니다.

웹 앱이 매우 많이 사용되어 응답 지연 시간이 2초를 초과합니다. 이 경우 알림 정책은 다음과 같이 응답합니다.

  1. HTTP 지연 시간 측정이 2초를 초과하면 Monitoring이 5분 타이머를 시작합니다.

  2. 다음 5분 동안 수신된 각 지연 시간 측정이 2초를 초과하면 타이머가 만료됩니다. 타이머가 만료되면 Monitoring은 조건을 충족한 것으로 표시하고 이슈를 개설하고 지원팀에 이메일을 보냅니다.

  3. 지원팀이 이메일을 수신하고 Cloud Console에 로그인하고 알림 수신을 확인합니다.

  4. 알림 이메일의 문서에 따라 지원팀은 지연 시간의 원인을 해결할 수 있습니다. 몇 분 내에 HTTP 응답 지연 시간이 2초 미만으로 떨어집니다.

  5. Monitoring은 2초 미만의 HTTP 지연 시간 측정을 수신하면 이슈를 종료하고 지원팀에 이슈가 종료되었다는 알림을 전송합니다.

이슈가 종료된 후 HTTP 응답 지연 시간이 2초를 초과하고 5분 동안 해당 임곗값보다 높게 유지되는 경우 Monitoring은 새 이슈를 개설하고 알림 이메일을 전송합니다.

알림 정책 추가 방법

Google Cloud Console, Cloud Monitoring API, Cloud SDK를 사용하여 알림 정책을 Google Cloud 프로젝트에 추가할 수 있습니다.

  • Cloud Console을 사용하는 경우 권장 알림을 사용 설정하거나 Cloud Monitoring의 알림 페이지에서 알림을 만들 수 있습니다.

    일부 Google Cloud 제품에는 권장 알림을 사용할 수 있습니다. 이러한 알림에는 알림 채널 추가와 같은 최소한의 구성이 필요합니다. 예를 들어 Pub/Sub Lite 주제 페이지를 보고 있는 경우 할당량 한도에 도달하면 알려주는 알림을 사용 설정할 수 있습니다. 마찬가지로 Monitoring 내에서 VM 인스턴스 페이지를 보고 있는 경우 해당 인스턴스의 메모리 사용률 및 네트워크 지연 시간을 모니터링하는 권장 알림 정책을 사용 설정할 수 있습니다.

    Cloud Monitoring의 알림 페이지에서 알림 정책을 만드는 방법은 Cloud Console을 사용하여 알림 정책 만들기를 참조하세요.

  • Cloud Monitoring API를 직접 사용하거나 Cloud SDK를 사용하는 경우 알림 정책을 만들고 보고 수정할 수 있습니다. 알림 정책의 조건으로 두 측정항목의 비율을 계산한 다음 임곗값과 비교하려면 Cloud Monitoring API 또는 Cloud SDK를 사용하여 정책을 만들어야 합니다. 이러한 유형의 정책에 대한 예시는 측정항목 비율을 참조하세요.

    Cloud Monitoring API 및 Cloud SDK 사용에 대한 자세한 내용은 Cloud Monitoring API 또는 Cloud SDK를 사용하여 알림 정책 만들기를 참조하세요.

Cloud Monitoring은 Google Cloud Console 및 Cloud Monitoring API와 함께 사용할 수 있는 표현적인 텍스트 기반 언어를 지원합니다. 알림에서 이 언어 사용에 대한 자세한 내용은 모니터링 쿼리 언어(MQL)를 사용하여 알림 정책 만들기를 참조하세요.

알림 정책 관리 방법

프로젝트의 알림 정책 목록을 보는 방법과 이러한 정책을 수정하는 방법에 대한 자세한 내용은 다음을 참조하세요.

알림 정책을 만드는 데 필요한 승인

이 섹션에서는 알림 정책을 만드는 데 필요한 역할 또는 권한에 대해 설명합니다. Cloud Monitoring의 Identity and Access Management(IAM)에 대한 상세 내용은 액세스 제어를 참조하세요.

각 IAM 역할에는 ID와 이름이 있습니다. 역할 ID는 roles/monitoring.editor 형식이며 액세스 제어를 구성할 때 gcloud 명령줄 도구에 인수로 전달됩니다. 자세한 내용은 액세스 권한 부여, 변경, 취소를 참조하세요. 모니터링 편집기와 같은 역할 이름은 Cloud Console에 표시됩니다.

필수 Cloud Console 역할

알림 정책을 만들려면 Google Cloud 프로젝트의 IAM 역할 이름이 다음 중 하나여야 합니다.

  • 모니터링 편집자
  • 모니터링 관리자
  • 프로젝트 소유자

역할 및 관련된 권한 목록을 보려면 역할을 참조하세요.

필수 API 권한

Cloud Monitoring API를 사용하여 알림 정책을 만들려면 Google Cloud 프로젝트의 IAM 역할 ID는 다음 중 하나여야 합니다.

  • roles/monitoring.alertPolicyEditor: 이 역할 ID는 알림 정책을 만드는 데 필요한 최소한의 권한을 부여합니다. 이 역할에 대한 상세 설명은 사전 정의된 알림 역할을 참조하세요.
  • role/monitoring.editor
  • role/monitoring.admin
  • role/owner

특정 Cloud Monitoring API 메서드에 필요한 권한을 확인하려면 Cloud Monitoring API 권한을 참조하세요. 역할 및 관련된 권한 목록을 보려면 역할을 참조하세요.

역할 확인

Cloud Console을 사용하여 프로젝트의 역할을 확인하려면 다음 절차를 따르세요.

  1. Cloud Console을 열고 Google Cloud 프로젝트를 선택합니다.

    Cloud Console로 이동

  2. 역할을 보려면 IAM 및 관리자를 클릭합니다. 역할은 사용자 이름과 같은 줄에 있습니다.

조직 수준의 권한을 확인하려면 해당 조직의 관리자에게 문의하세요.

알림 정책과 관련된 비용

알림 정책 또는 업타임 체크를 사용할 때는 비용이 발생하지 않지만 다음 제한이 적용됩니다.

카테고리
작업공간 또는 측정항목 범위당 업타임 체크1 100
작업공간 또는 측정항목 범위당 알림 정책2 500
알림 정책당 조건 6
알림 정책당 알림 채널 16
작업공간 또는 측정항목 범위당 알림 채널 4000
알림 정책당 동시 미해결 이슈 5,000
측정항목 부재 조건의 최대 기간 1일
측정항목 기준 조건의 최대 기간 23시간 30분
1이 한도는 업타임 체크 구성의 수에 적용됩니다. 각 업타임 체크 구성은 지정된 리소스 상태 테스트 사이의 시간 간격을 포함합니다. 자세한 내용은 업타임 체크 관리를 참조하세요.

2ApigeeApigee Hybrid는 Cloud Monitoring과 긴밀하게 통합됩니다. Standard, Enterprise, Enterprise Plus 등 모든 Apigee 구독 수준의 알림 한도는 Cloud Monitoring의 경우와 같습니다(작업공간 또는 측정항목 범위당 500개).

전체 가격 책정 정보는 Google Cloud 운영 제품군 가격 책정을 참조하세요.

다음 단계