Nesta página, descrevemos como configurar alertas sobre o nível de risco e o motivo do risco de RPO de planos de backup com base nos eventos de registro emitidos pelo Backup para GKE na Análise de registros.
No contexto do planejamento de recuperação de desastres ou continuidade de negócios, o objetivo do ponto de recuperação (RPO) significa o momento mais recente em que os dados precisam ser restaurados. Ele especifica a perda máxima de dados devido a uma falha de infraestrutura, que é expressa como a quantidade de tempo, antes da falha, em que a atividade de gravação é perdida.
A coluna Nível de risco de RPO indica o nível atual de risco de RPO do plano de backup. O campo "Motivo do risco" detalha por que o plano de backup está em um nível de risco específico.
Tanto o nível quanto o motivo do risco de RPO têm um mapeamento de muitos para um. Ou seja, um nível de risco de RPO 4 pode ter vários motivos. Para uma lista completa de níveis de risco de RPO e os motivos correspondentes, consulte a tabela a seguir.
Mapeamento entre níveis e motivos de risco de RPO
Nível de risco de RPO | Motivo do risco de RPO |
---|---|
1 | Nenhum risco detectado para este BackupPlan. |
2 | Este BackupPlan teve falhas de backup recentes. |
2 | Na fase de treinamento, e o nível de risco estará disponível após pelo menos quatro backups bem-sucedidos. |
2 | Nenhuma configuração de RPO foi definida. Mude para um cronograma de RPO para ter uma proteção melhor. |
2 | Nenhuma programação foi definida. Ative uma programação de RPO para ter mais proteção. |
3 | Os backups recentes estão demorando mais. Se essa tendência continuar, há o risco de o RPO não ser mais atendido. |
3 | A criação do backup mais recente falhou. |
3 | A execução de backup mais recente falhou. |
3 | A programação está pausada. |
3 | Este BackupPlan teve falhas de backup recentes e a programação está pausada. |
3 | Na fase de treinamento, mas este BackupPlan tem falhas de backup recentes. |
3 | Na fase de treinamento, mas a criação do backup mais recente falhou. |
3 | Na fase de treinamento, mas a execução do backup mais recente falhou. |
3 | Nenhuma configuração de RPO foi definida, e este BackupPlan tem falhas de backup recentes. Mude para uma programação de RPO depois que a falha for resolvida. |
3 | Nenhuma programação foi definida e os backups recentes falharam. Ative uma programação de RPO para ter mais proteção. |
4 | Os backups recentes estão demorando mais, e a programação foi pausada. Se essa tendência continuar após a retomada da programação, há o risco de o RPO não ser mais atendido. |
4 | A criação do backup mais recente falhou e a programação foi pausada. |
4 | A execução do backup mais recente falhou, e a programação foi pausada. |
4 | Na fase de treinamento, mas a programação está pausada. Ative a programação para permitir que o treinamento seja concluído. |
4 | Na fase de treinamento, mas o BackupPlan tem falhas de backup recentes e o agendamento está pausado. |
4 | Na fase de treinamento, mas a criação do backup mais recente falhou e o agendamento está pausado. |
4 | Na fase de treinamento, mas a execução do backup mais recente falhou e a programação está pausada. |
4 | Nenhuma configuração de RPO foi definida e a criação do backup mais recente falhou. Mude para uma programação de RPO depois que a falha for resolvida. |
4 | Nenhuma configuração de RPO foi definida, e a execução do backup mais recente falhou. Mude para uma programação de RPO depois que a falha for resolvida. |
4 | Nenhuma configuração de RPO está definida e a programação do cron está pausada. Mude para um cronograma de RPO para ter uma proteção melhor. |
4 | Nenhuma configuração de RPO está definida, e a programação do cron está pausada devido a falhas recentes de backup. Mude para uma programação de RPO depois que a falha for resolvida. |
4 | Nenhuma configuração de RPO foi definida, e a programação cron foi pausada porque a criação do backup mais recente falhou. Mude para uma programação de RPO depois que a falha for resolvida. |
4 | Nenhuma configuração de RPO está definida, e o cronograma do cron está pausado porque a execução do backup mais recente falhou. Mude para uma programação de RPO depois que a falha for resolvida. |
4 | Nenhum cronograma está definido, e a execução do backup mais recente falhou. Ative uma programação de RPO para ter mais proteção. |
5 | Este BackupPlan violou o RPO. Resolva falhas de backup, atualize o RPO de destino e as janelas de exclusão ou reduza o escopo do backup conforme necessário para esse BackupPlan. |
5 | Este BackupPlan violou o RPO e a programação está pausada. Resolva falhas de backup, atualize o RPO de destino e a janela de exclusão ou reduza o escopo do backup conforme necessário para esse BackupPlan. |
Antes de começar
Antes de configurar uma política de alertas, verifique se você tem um canal de notificação adequado.
Criar um alerta
Para mais informações sobre como criar políticas gerais de alertas com base em registros, consulte Configurar políticas de alertas com base em registros. Ou, para criar uma política de alertas especificamente para mudanças no nível de risco do RPO ou nos motivos de risco do RPO em planos de backup, faça o seguinte:
Acesse a página do Explorador de registros. Acessar o Explorador de registros
No painel Consulta, insira os seguintes critérios de filtro:
logName="projects/PROJECT_ID/logs/gkebackup.googleapis.com%2Fbackup_plan_change" resource.type="gkebackup.googleapis.com/BackupPlan" resource.labels.backup_plan_id="BACKUP_PLAN" resource.labels.location="LOCATION" jsonPayload.backupPlanMetadata.rpoRiskLevel>="VALUE" jsonPayload.backupPlanMetadata.rpoRiskReason="REASON"
Substitua:
PROJECT_ID
: o ID do seu Google Cloud projeto.BACKUP_PLAN
: o nome do plano de backup para o qual você quer gerar alertas.LOCATION
: a região de computação do plano de backup para o qual você quer gerar alertas. Por exemplo,us-central1.
VALUE
: o valor do nível de risco de RPO para o plano de backup sobre o qual você quer receber alertas. Os valores válidos estão no intervalo [1,5]. Recomendamos configurar alertas para nível de risco >= 4.REASON
: (opcional) selecione um motivo de risco adequado na tabela.
Para validar a consulta, clique em Executar consulta.
Na barra de ferramentas Resultados da consulta, expanda o menu Ações e selecione Criar alerta de registro.
No painel Detalhes do alerta, insira um nome para a política de alertas no campo Nome da política de alertas. Por exemplo,
Alert for RPO risk level of backup plan
.Selecione uma opção no menu Nível de gravidade da política. Os incidentes e as notificações mostram o nível de gravidade. Recomendamos definir o nível de gravidade como Crítico.
Insira uma descrição para sua política de alertas. Você também pode incluir informações que possam ajudar o destinatário de uma notificação a diagnosticar o problema. Para informações sobre como formatar e refinar o conteúdo desse campo, consulte Como usar o Markdown e variáveis em modelos de documentação.
Clique em Próxima.
Defina o Tempo entre as notificações e a Duração do fechamento automático de incidentes. Recomendamos definir o tempo entre as notificações como um dia e a duração do fechamento automático como sete dias.
Clique em Próxima.
Selecione um ou mais canais de notificação para sua política de alertas.
Clique em Salvar.
Depois de salvar a política, você vai receber alertas nos canais de notificação quando um plano de backup corresponder ao filtro.