Criar políticas de alertas baseadas em métricas para SAP em Google Cloud

Para monitorar seus sistemas SAP no Google Cloud, configure as políticas de alertas do Cloud Monitoring que notificam os administradores SAP sobre possíveis configurações incorretas ou falhas de recursos.

Neste documento, descrevemos alguns problemas comuns de alta disponibilidade e mostramos como criar políticas de alertas para eles ou usar os alertas de exemplo como referência para criar seus próprios alertas personalizados. Os alertas de exemplo descritos neste documento usam a linguagem de consulta do Monitoring (MQL) para consultar métricas geradas pelo Agente doGoogle Cloudpara SAP. Embora, por padrão, esses alertas se apliquem a todos os sistemas SAP em um determinado projeto do Google Cloud, é possível personalizar os alertas para filtrar os SIDs necessários ou ajustar o tempo decorrido para acionar o alerta.

Para mais informações sobre como os alertas do Cloud Monitoring funcionam, consulte Visão geral de alertas.

Antes de começar

Importar políticas de alertas predefinidas

OGoogle Cloud fornece políticas de alertas predefinidas que podem ser importadas e configuradas para alguns problemas comuns de alta disponibilidade. Para saber mais, consulte as seguintes seções:

Importar alertas para a detecção de restrição de local

Quando você move manualmente um recurso em um cluster do Pacemaker usando os comandos do cluster, ele recebe uma restrição ou a preferência do cliente é definida para favorecer um nó específico. Essa situação pode impedir que o recurso faça o failover em caso de interrupção do serviço do sistema. Para mais informações, consulte a seção Como mover um recurso da documentação do ClusterLabs.

Para receber notificações sobre essa situação no seu sistema de alta disponibilidade da SAP em execução no Google Cloud, importe a política de alertas predefinida Pacemaker: Location constraint detected.

Essa política de alertas notifica quando uma restrição baseada em preferência é detectada e encaminha os administradores da SAP à seção "Afinidade não intencional de nós que favorece um nó específico" do guia Como solucionar problemas de configurações de alta disponibilidade para SAP. Essa política usa a métrica de monitoramento de processos workload.googleapis.com/sap/validation/pacemaker, que é coletada pelo agente do Google Cloudpara SAP.

Para importar essa política de alertas no seu projeto do Google Cloud usando o console do Google Cloud, conclua as seguintes etapas:

  1. No console do Google Cloud, acesse a página  Integrações:

    Acessar Integrações

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.

  2. Filtre por Google Cloud Agent for SAP e clique em Ver detalhes.
  3. Navegue até a guia Alertas.
  4. Selecione Pacemaker: Location constraint detected e clique em Mostrar opções > Personalizar política de alertas.
  5. Opcional: para configurar alertas para um ou mais sistemas SAP específicos, e não para todos os sistemas SAP no projeto do Google Cloud, atualize a instrução filter no Editor de consultas da seguinte maneira:
    1. Remova o caractere # que precede a variável sid.
    2. Especifique os SIDs necessários. Para especificar vários SIDs, separe-os usando o caractere |. Veja a seguir um exemplo dessa instrução de filtro:
      sid=~"ABC|HDB|XYZ"

      Neste exemplo, ABC, XYZ e HDB são SIDs.

  6. Opcional: para personalizar o tempo decorrido antes de acionar um alerta, atualize a instrução window no Editor de consultas e especifique a unidade de medida preferencial:
    1. Por exemplo, para definir um limite de tempo de três minutos, defina:
      | window 3m
  7. Em Detalhes do alerta, navegue até a guia Notificações e nome.
  8. Selecione os canais de notificação necessários.
  9. Analise o alerta e clique em Criar política.

Importar alertas para a detecção de falhas de recursos

No sistema de alta disponibilidade, se um agente de recursos em execução falhar, o Pacemaker tentará interromper esse agente e reiniciá-lo. Se a operação de reinicialização falhar por qualquer motivo, o Pacemaker definirá o valor failcount desse agente de recursos como INFINITY (se start-failure-is-fatal estiver definido como true, que é o padrão) e tentará iniciar o agente em outro nó. Se o agente de recursos não for iniciado em todos os nós, ele permanecerá com o status Stopped. Para restaurar esse agente de recursos de volta a um estado operacional, um administrador da SAP precisa limpar manualmente a contagem de falhas do agente de recursos. Para mais informações sobre o comportamento da contagem de falhas do Pacemaker, consulte a documentação do ClusterLabs.

Para receber notificações sobre essa situação no seu sistema de alta disponibilidade da SAP em execução no Google Cloud, importe a política de alertas predefinida Pacemaker: Resource failed to start.

Essa política de alertas notifica quando um agente de recursos não é iniciado e permanece no status Stopped por mais de três minutos. Essa política encaminha o administrador do SAP à seção "O agente de recursos foi interrompido" do guia Como solucionar problemas de configurações de alta disponibilidade para SAP. Essa política usa a métrica de monitoramento de processos workload.googleapis.com/sap/cluster/failcounts, que é coletada pelo agente do Google Cloudpara SAP.

Para importar essa política de alertas no seu projeto do Google Cloud usando o console do Google Cloud, conclua as seguintes etapas:

  1. No console do Google Cloud, acesse a página  Integrações:

    Acessar Integrações

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.

  2. Filtre por Google Cloud Agent for SAP e clique em Ver detalhes.
  3. Navegue até a guia Alertas.
  4. Selecione Pacemaker: Resource failed to start e clique em Mostrar opções > Personalizar política de alertas.
  5. Opcional: para configurar alertas para um ou mais sistemas SAP específicos, e não para todos os sistemas SAP no projeto do Google Cloud, atualize a instrução filter no Editor de consultas da seguinte maneira:
    1. Remova o caractere # que precede a variável sid.
    2. Especifique os SIDs necessários. Para especificar vários SIDs, separe-os usando o caractere |. Veja a seguir um exemplo dessa instrução de filtro:
      sid=~"ABC|HDB|XYZ"

      Neste exemplo, ABC, XYZ e HDB são SIDs.

  6. Opcional: para personalizar o tempo decorrido antes de acionar um alerta, atualize a instrução window no Editor de consultas e especifique a unidade de medida preferencial:
    1. Por exemplo, para definir um limite de tempo de três minutos, defina:
      | window 3m
  7. Em Detalhes do alerta, navegue até a guia Notificações e nome.
  8. Selecione os canais de notificação necessários.
  9. Analise o alerta e clique em Criar política.

Importar alertas para erros de replicação do SAP HANA

Em caso de interrupção no site principal do SAP HANA, não será possível fazer um failover automático do sistema principal para o secundário se este não estiver sincronizado com o principal.

Essa política de alerta notifica quando o status de replicação de um sistema SAP HANA de alta disponibilidade não está sincronizado por mais de um minuto. Essa política usa a métrica de monitoramento de processos workload.googleapis.com/sap/hana/ha/replication, que é derivada do script systemReplication.py. Esta política indica ao administrador do SAP que ele precisa verificar o status e a conectividade de rede dos sistemas SAP HANA principal e secundário.

Para receber notificações sobre essa situação no seu sistema de alta disponibilidade da SAP HANA em execução no Google Cloud, importe a política de alertas predefinida SAP HANA Replication is not in sync.

Para importar essa política de alertas no seu projeto do Google Cloud usando o console do Google Cloud, conclua as seguintes etapas:

  1. No console do Google Cloud, acesse a página  Integrações:

    Acessar Integrações

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.

  2. Filtre por Google Cloud Agent for SAP e clique em Ver detalhes.
  3. Navegue até a guia Alertas.
  4. Selecione SAP HANA Replication is not in sync e clique em Mostrar opções > Personalizar política de alertas.
  5. Opcional: para configurar alertas para um ou mais sistemas SAP específicos, e não para todos os sistemas SAP no projeto do Google Cloud, atualize a instrução filter no Editor de consultas da seguinte maneira:
    1. Remova o caractere # que precede a variável sid.
    2. Especifique os SIDs necessários. Para especificar vários SIDs, separe-os usando o caractere |. Veja a seguir um exemplo dessa instrução de filtro:
      sid=~"ABC|HDB|XYZ"

      Neste exemplo, ABC, XYZ e HDB são SIDs.

  6. Opcional: para personalizar o tempo decorrido antes de acionar um alerta, atualize a instrução window no Editor de consultas e especifique a unidade de medida preferencial:
    1. Por exemplo, para definir um limite de tempo de três minutos, defina:
      | window 3m
  7. Em Detalhes do alerta, navegue até a guia Notificações e nome.
  8. Selecione os canais de notificação necessários.
  9. Analise o alerta e clique em Criar política.

Criar uma política de alertas personalizada

Além de importar políticas de alertas predefinidas, é possível atualizá-las para criar políticas personalizadas que atendam aos seus requisitos. Para isso, use o console do Google Cloud, a API Cloud Monitoring, a CLI do Google Cloud ou o Terraform.

Para começar, recomendamos que você leia o resumo de exemplos de políticas de alertas e as políticas de alertas pré-configuradas descritas neste documento.

Para informações sobre como gerenciar ou modificar políticas de alertas, consulte este link.