Criar políticas de alertas baseadas em métricas para SAP no Google Cloud

Para monitorar seus sistemas SAP no Google Cloud, configure as políticas de alertas do Cloud Monitoring que notificam os administradores SAP sobre possíveis configurações incorretas ou falhas de recursos.

Neste documento, descrevemos alguns problemas comuns de alta disponibilidade e mostramos como criar políticas de alertas para eles ou usar os alertas de exemplo como referência para criar seus próprios alertas personalizados. Os alertas de exemplo descritos neste documento usam a linguagem de consulta do Monitoring (MQL, na sigla em inglês) para consultar métricas geradas pelo Agente do Google Cloud para SAP. Embora, por padrão, esses alertas se apliquem a todos os sistemas SAP em um determinado projeto do Google Cloud, é possível personalizar os alertas para filtrar os SIDs necessários ou ajustar o tempo decorrido para acionar o alerta.

Para mais informações sobre como os alertas do Cloud Monitoring funcionam, consulte Visão geral de alertas.

Antes de começar

  • Familiarize-se com os conceitos gerais das políticas de alertas do Monitoring. Para informações sobre políticas de alertas, consulte Visão geral de alertas.

  • Em cada instância que hospeda o sistema SAP que você quer monitorar, verifique se o Agente do Google Cloud para SAP está instalado e configurado para coletar as métricas de monitoramento de processos.

  • Para ter as permissões necessárias para criar e modificar políticas de alertas usando o console do Google Cloud, peça ao administrador para conceder a você os seguintes papéis do IAM no seu projeto:

    Para mais informações sobre como conceder papéis, consulte Gerenciar acesso.

    Também é possível conseguir as permissões necessárias com papéis personalizados ou outros papéis predefinidos.

  • Para receber os alertas, crie os canais de notificação necessários. Para fins de redundância, recomendamos que você crie vários canais de notificação. Para saber mais, consulte Criar e gerenciar canais de notificação.

Importar políticas de alertas predefinidas

O Google Cloud fornece políticas de alertas predefinidas que podem ser importadas e configuradas para alguns problemas comuns de alta disponibilidade. Para saber mais, consulte as seguintes seções:

Importar alertas para a detecção de restrição de local

Quando você move manualmente um recurso em um cluster do Pacemaker usando os comandos do cluster, ele recebe uma restrição ou a preferência do cliente é definida para favorecer um nó específico. Essa situação pode impedir que o recurso faça o failover em caso de interrupção do serviço do sistema. Para mais informações, consulte a seção Como mover um recurso da documentação do ClusterLabs.

Para receber notificações sobre essa situação no seu sistema de alta disponibilidade da SAP em execução no Google Cloud, importe a política de alertas predefinida Pacemaker: Location constraint detected.

Essa política de alertas notifica quando uma restrição baseada em preferência é detectada e encaminha os administradores da SAP à seção "Afinidade não intencional de nós que favorece um nó específico" do guia Como solucionar problemas de configurações de alta disponibilidade para SAP. Essa política usa a métrica de monitoramento de processos workload.googleapis.com/sap/validation/pacemaker, que é coletada pelo agente do Google Cloud para SAP.

Para importar essa política de alertas no seu projeto do Google Cloud usando o console do Google Cloud, conclua as seguintes etapas:

  1. No console do Google Cloud, acesse a página  Integrações:

    Acessar Integrações

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.

  2. Filtre por Google Cloud Agent for SAP e clique em Ver detalhes.
  3. Navegue até a guia Alertas.
  4. Selecione Pacemaker: Location constraint detected e clique em Mostrar opções > Personalizar política de alertas.
  5. Opcional: para configurar alertas para um ou mais sistemas SAP específicos, e não para todos os sistemas SAP no projeto do Google Cloud, atualize a instrução filter no Editor de consultas da seguinte maneira:
    1. Remova o caractere #.
    2. Especifique os SIDs necessários. Para especificar vários SIDs, separe-os usando o caractere |. Veja a seguir um exemplo dessa instrução de filtro:
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      Neste exemplo, ABC, XYZ e HDB são SIDs.

  6. Opcional: para personalizar o tempo decorrido antes de acionar um alerta, atualize a instrução window no Editor de consultas e especifique a unidade de medida preferencial:
    1. Por exemplo, para definir um limite de tempo de três minutos, defina:
      | window 3m
  7. Em Detalhes do alerta, navegue até a guia Notificações e nome.
  8. Selecione os canais de notificação necessários.
  9. Analise o alerta e clique em Criar política.

Importar alertas para a detecção de falhas de recursos

No sistema de alta disponibilidade, se um agente de recursos em execução falhar, o Pacemaker tentará interromper esse agente e reiniciá-lo. Se a operação de reinicialização falhar por qualquer motivo, o Pacemaker definirá o valor failcount desse agente de recursos como INFINITY (se start-failure-is-fatal estiver definido como true, que é o padrão) e tentará iniciar o agente em outro nó. Se o agente de recursos não for iniciado em todos os nós, ele permanecerá com o status Stopped. Para restaurar esse agente de recursos de volta a um estado operacional, um administrador da SAP precisa limpar manualmente a contagem de falhas do agente de recursos. Para mais informações sobre o comportamento da contagem de falhas do Pacemaker, consulte a documentação do ClusterLabs.

Para receber notificações sobre essa situação no seu sistema de alta disponibilidade da SAP em execução no Google Cloud, importe a política de alertas predefinida Pacemaker: Resource failed to start.

Essa política de alertas notifica quando um agente de recursos não é iniciado e permanece no status Stopped por mais de três minutos. Essa política encaminha o administrador do SAP à seção "O agente de recursos foi interrompido" do guia Como solucionar problemas de configurações de alta disponibilidade para SAP. Essa política usa a métrica de monitoramento de processos workload.googleapis.com/sap/cluster/failcounts, que é coletada pelo agente do Google Cloud para SAP.

Para importar essa política de alertas no seu projeto do Google Cloud usando o console do Google Cloud, conclua as seguintes etapas:

  1. No console do Google Cloud, acesse a página  Integrações:

    Acessar Integrações

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.

  2. Filtre por Google Cloud Agent for SAP e clique em Ver detalhes.
  3. Navegue até a guia Alertas.
  4. Selecione Pacemaker: Resource failed to start e clique em Mostrar opções > Personalizar política de alertas.
  5. Opcional: para configurar alertas para um ou mais sistemas SAP específicos, e não para todos os sistemas SAP no projeto do Google Cloud, atualize a instrução filter no Editor de consultas da seguinte maneira:
    1. Remova o caractere #.
    2. Especifique os SIDs necessários. Para especificar vários SIDs, separe-os usando o caractere |. Veja a seguir um exemplo dessa instrução de filtro:
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      Neste exemplo, ABC, XYZ e HDB são SIDs.

  6. Opcional: para personalizar o tempo decorrido antes de acionar um alerta, atualize a instrução window no Editor de consultas e especifique a unidade de medida preferencial:
    1. Por exemplo, para definir um limite de tempo de três minutos, defina:
      | window 3m
  7. Em Detalhes do alerta, navegue até a guia Notificações e nome.
  8. Selecione os canais de notificação necessários.
  9. Analise o alerta e clique em Criar política.

Criar uma política de alertas personalizada

Além de importar políticas de alertas predefinidas, é possível atualizá-las para criar políticas personalizadas que atendam aos seus requisitos. Para isso, use o console do Google Cloud, a API Cloud Monitoring, a CLI do Google Cloud ou o Terraform.

Para começar, recomendamos que você leia o resumo de exemplos de políticas de alertas e as políticas de alertas pré-configuradas descritas neste documento.

Para informações sobre como gerenciar ou modificar políticas de alertas, consulte este link.