백업 계획의 RPO 위험 상태에 대한 알림 설정


이 페이지에서는 로그 탐색기에서 Backup for GKE에서 내보낸 로그 이벤트를 기반으로 하는 백업 계획의 RPO 위험 수준 및 위험 이유에 대한 알림을 설정하는 방법을 설명합니다.

재해 복구 또는 비즈니스 연속성 계획의 맥락에서 목표 복구 시간(RPO)은 데이터를 복원해야 하는 가장 최근 시점을 의미합니다. 인프라 장애로 인한 최대 데이터 손실을 지정합니다. 이는 장애 발생 전 쓰기 활동이 손실되는 시간으로 표현됩니다.

RPO 위험 수준 열은 백업 계획의 현재 RPO 위험 수준을 나타냅니다. 위험 이유 필드에는 백업 계획이 특정 위험 수준인 이유에 대한 세부정보가 표시됩니다.

RPO 위험 수준과 위험 이유는 다대일 매핑을 갖습니다. 즉, RPO 위험 수준이 4인 경우 그 이유가 여러 가지일 수 있습니다. RPO 위험 수준과 해당 이유의 전체 목록은 다음 표를 참고하세요.

RPO 위험 수준과 위험 이유 간의 매핑

RPO 위험 수준 RPO 위험 이유
1 이 BackupPlan에서 감지된 위험이 없습니다.
2 이 BackupPlan에 최근 백업 실패가 있습니다.
2 학습 단계에 있으며, 성공적인 백업이 4개 이상이면 위험 수준을 확인할 수 있습니다.
2 RPO 구성이 정의되지 않았습니다. 더 나은 보호를 위해 RPO 일정으로 전환하세요.
2 정의된 일정이 없습니다. 더 나은 보호를 위해 RPO 일정을 선택하세요.
3 최근 백업에 시간이 더 오래 걸립니다. 이 추세가 계속되면 RPO를 더 이상 충족하지 못할 위험이 있습니다.
3 최근 백업 생성에 실패했습니다.
3 최근 백업 실행이 실패했습니다.
3 일정이 일시중지되었습니다.
3 이 BackupPlan에 최근 백업 실패가 발생했으며 일정이 일시중지되었습니다.
3 학습 단계에 있지만 이 BackupPlan에 최근 백업 실패가 있습니다.
3 학습 단계에 있지만 가장 최근 백업 생성에 실패했습니다.
3 학습 단계에 있지만 가장 최근 백업 실행이 실패했습니다.
3 RPO 구성이 정의되어 있지 않고 이 BackupPlan에 최근 백업 실패가 있습니다. 장애가 해결된 후 RPO 일정으로 전환합니다.
3 일정이 정의되어 있지 않고 최근 백업이 실패했습니다. 더 나은 보호를 위해 RPO 일정을 선택하세요.
4 최근 백업에 시간이 더 오래 걸리고 일정이 일시중지되었습니다. 일시중지된 일정을 다시 시작한 후에도 이러한 추세가 계속되면 RPO가 더 이상 충족되지 않을 위험이 있습니다.
4 최근 백업 생성에 실패하여 일정이 일시중지되었습니다.
4 최근 백업 실행이 실패하여 일정이 일시중지되었습니다.
4 학습 단계에 있지만 일정이 일시중지되었습니다. 학습이 완료되도록 일정을 재개합니다.
4 학습 단계에 있지만 이 BackupPlan에 최근 백업 실패가 있고 일정이 일시중지되었습니다.
4 학습 단계에 있지만 최근 백업 생성에 실패하고 일정이 일시중지되었습니다.
4 학습 단계에 있지만 최근 백업 실행이 실패하고 일정이 일시중지되었습니다.
4 RPO 구성이 정의되지 않았으며 가장 최근 백업 생성이 실패했습니다. 장애가 해결된 후 RPO 일정으로 전환합니다.
4 RPO 구성이 정의되지 않았으며 가장 최근 백업 실행이 실패했습니다. 장애가 해결된 후 RPO 일정으로 전환합니다.
4 RPO 구성이 정의되지 않았으며 크론 일정이 일시중지되었습니다. 더 나은 보호를 위해 RPO 일정으로 전환하세요.
4 RPO 구성이 정의되지 않았으며 최근 백업 실패로 인해 크론 일정이 일시중지되었습니다. 장애가 해결된 후 RPO 일정으로 전환합니다.
4 RPO 구성이 정의되지 않았으며 최근 백업 생성이 실패하여 크론 일정이 일시중지되었습니다. 장애가 해결된 후 RPO 일정으로 전환합니다.
4 RPO 구성이 정의되지 않았으며 최근 백업 실행이 실패하여 크론 일정이 일시중지되었습니다. 장애가 해결된 후 RPO 일정으로 전환합니다.
4 일정이 정의되지 않았으며 최근 백업 실행이 실패했습니다. 더 나은 보호를 위해 RPO 일정을 선택하세요.
5 이 BackupPlan이 RPO를 위반했습니다. 이 BackupPlan에 필요한 경우 백업 실패를 해결하거나, 목표 RPO 및 제외 기간을 업데이트하거나, 백업 범위를 축소합니다.
5 이 BackupPlan이 RPO를 위반하여 일정이 일시중지되었습니다. 이 BackupPlan에 필요한 경우 백업 실패를 해결하거나, 목표 RPO 및 제외 기간을 업데이트하거나, 백업 범위를 축소합니다.

시작하기 전에

알림 정책을 설정하기 전에 적절한 알림 채널이 있는지 확인합니다.

알림 만들기

일반 로그 기반 알림 정책을 만드는 방법에 대한 자세한 내용은 로그 기반 알림 정책 구성을 참고하세요. 또는 백업 계획의 RPO 위험 수준 또는 RPO 위험 이유 변경에 대해 알림 정책을 만들려면 다음 단계를 따르세요.

  1. 로그 탐색기 페이지로 이동합니다. 로그 탐색기로 이동

  2. 쿼리 창에 다음 필터 조건을 입력합니다.

    logName="projects/PROJECT_ID/logs/gkebackup.googleapis.com%2Fbackup_plan_change"
    resource.type="gkebackup.googleapis.com/BackupPlan"
    resource.labels.backup_plan_id="BACKUP_PLAN"
    resource.labels.location="LOCATION"
    jsonPayload.backupPlanMetadata.rpoRiskLevel>="VALUE"
    jsonPayload.backupPlanMetadata.rpoRiskReason="REASON"
    

    다음을 바꿉니다.

    • PROJECT_ID: Google Cloud 프로젝트의 ID입니다.
    • BACKUP_PLAN: 알림을 생성할 백업 계획의 이름
    • LOCATION: 알림을 생성할 백업 계획의 컴퓨팅 리전입니다. 예를 들면 us-central1.입니다.
    • VALUE: 알림을 받을 백업 계획의 RPO 위험 수준 값입니다. 유효한 값은 [1,5] 범위에 있습니다. 위험 수준이 4 이상인 경우 알림을 설정하는 것이 좋습니다.
    • REASON: (선택사항) 에서 적절한 위험 이유를 선택합니다.
  3. 쿼리를 검사하기 위해 쿼리 실행을 클릭합니다.

  4. 쿼리 결과 툴바에서 작업 메뉴를 펼치고 로그 알림 만들기를 선택합니다.

  5. 알림 세부정보 창의 알림 정책 이름 필드에 알림 정책의 이름을 입력합니다. 예를 들면 Alert for RPO risk level of backup plan입니다.

  6. 정책 심각도 수준 메뉴에서 옵션을 선택합니다. 이슈 및 알림에 심각도 수준이 표시됩니다. 심각도 수준을 심각으로 설정하는 것이 좋습니다.

  7. 알림 정책에 대한 설명을 입력합니다. 알림 수신자가 문제를 진단하는 데 도움이 되는 정보를 포함할 수도 있습니다. 이 필드의 콘텐츠 형식을 지정하고 다듬는 방법에 대한 자세한 내용은 문서 템플릿에서 마크다운 및 변수 사용을 참조하세요.

  8. 다음을 클릭합니다.

  9. 알림 시간 간격사고 자동 종료 기간을 설정합니다. 알림 시간 간격은 1일, 자동 종료 기간은 7일로 설정하는 것이 좋습니다.

  10. 다음을 클릭합니다.

  11. 알림 정책에 사용할 알림 채널을 하나 이상 선택합니다.

  12. 저장을 클릭합니다.

    정책을 저장한 후 백업 계획이 필터와 일치하면 알림 채널에 알림이 전송됩니다.