이 페이지에서는 Cloud Monitoring에서 Anthos Service Mesh에서 만든 서비스 수준 목표(SLO)에 대한 알림 정책을 만드는 방법을 설명합니다.
SLO에 대한 소개는 서비스 수준 목표 개요를 참조하세요.
Cloud Monitoring은 서비스가 SLO를 위반하는 경우 알림을 트리거할 수 있습니다. 오류 예산의 소진 속도를 기준으로 알림 정책을 만들 수 있습니다. 오류 예산에 대한 모든 알림은 일정 기간인 전환 확인 기간(예: 이전 60분) 동안 소진되는 규정 준수 기간의 오류 예산의 지정된 비율이라는 동일한 기본 조건을 갖습니다. 알림 정책을 만들면 Anthos Service Mesh가 SLO의 설정에 따라 대부분의 알림 조건이 자동으로 설정됩니다. 전환 확인 기간 및 소진율을 지정합니다.
전환 확인 기간 및 소진율에 설정해야 하는 값을 결정하기 까지는 시도 및 오류가 발생할 수 있습니다. 60분의 기본 전환 확인 기간을 시작점으로 사용할 수 있습니다. 소진율을 확인하려면 서비스 동작을 모니터링하여 규정 준수 기간의 총 오류 예산 대비 이전 60분 동안 소진된 비율을 확인합니다. 전환 확인 기간에 더 많은 오류 예산을 소진하지 않도록 소진율을 설정하는 것이 좋지만 알림을 불필요하게 울리지 않는 것이 좋습니다.
예를 들어 95% < 300ms Latency in Calendar Week
라는 SLO를 만든다고 가정해 보겠습니다.
이 SLO를 사용하면 일주일 동안 총 요청 수의 5%만 지연 시간이 300ms를 초과할 수 있습니다. 5%에 도달하거나 이를 초과하면 총 오류 예산이 소진됩니다. 전환 확인 기간을 1시간으로 설정하면 각 전환 확인 기간은 규정 준수 기간의 1/168
입니다(한 주 동안 168시간). 한 주의 총 오류 예산을 초과하지 않는 시간당 소진율을 계산하는 방법은 다음과 같습니다.
5%
÷ 168
≈ 0.3%
서비스 지연 시간은 부하 또는 기타 조건에 따라 변동될 수 있으므로 소진율로 0.3%을 설정하면 불필요한 알림이 트리거될 수 있습니다. 이 값의 두 배, 즉 0.6%로 시작하여 서비스를 모니터링하면서 필요에 따라 값을 조정할 수 있습니다.
시작하기 전에
서비스 중 하나의 SLO를 만듭니다.
SLO에서 알림 정책 만들기
서비스의 상태 탭으로 이동합니다.
Google Cloud 콘솔에서 Anthos Service Mesh로 이동합니다.
메뉴 바의 드롭다운 목록에서 Google Cloud 프로젝트를 선택합니다.
알림 정책을 만들려는 서비스를 클릭합니다.
왼쪽 탐색 메뉴에서 상태를 클릭합니다.
알림 정책을 만들 SLO를 클릭합니다.
오른쪽의 SLO의 현재 상태 섹션에서 알림 정책 만들기 링크를 클릭합니다.
조건 추가 대화상자가 표시됩니다. Anthos Service Mesh는 SLO의 설정에 따라 SLO 소진율 조건을 자동으로 채웁니다. SLO의 오류 예산이 너무 빠르게 감소할 때 알림을 받도록 SLO 소진율 조건을 구성합니다. SLO가 오류 예산을 소진하기 전에 알림을 받도록 해야 합니다.
조건을 구성합니다.
- 조건의 이름을 지정하려면 추천 이름 링크를 클릭하여 SLO를 기반으로 이름을 사용하거나 조건의 이름을 입력합니다.
- 목표 섹션의 전환 확인 기간 필드에 전환 확인 기간을 입력하거나 기본값을 사용합니다.
- 구성 섹션의 기준 필드에 소진율을 입력합니다.
- 저장을 클릭합니다. 새 알림 정책 만들기 창이 표시됩니다.
알림 정책을 구성합니다.
- 정책 이름을 입력합니다.
- 조건은 자동으로 입력되지만 원하는 경우 다른 조건을 추가할 수 있습니다.
- 알림 정책에 조건이 하나뿐인 경우 정책 트리거 필드를 모든 조건 충족 기본값 그대로 둡니다.
- 원하는 경우 알림 및 문서 섹션을 구성합니다. 자세한 내용은 알림 정책 관리를 참조하세요.
- 저장을 클릭합니다. 정책 세부정보 페이지가 표시됩니다.
- Anthos Service Mesh 대시보드로 돌아가서 탐색 메뉴 dehaze를 클릭하고 Anthos > 서비스로 이동합니다.
다음 단계
Google의 사이트 안정성 엔지니어링에서 알림에 대해 자세히 알아보세요.