Monitoramento de processos usando o agente do Google Cloud para SAP

O foco deste guia de planejamento é o recurso de coleta de métricas do monitoramento de processos do agente do Google Cloud para SAP. Para informações sobre o agente e todos os recursos dele, consulte o guia de planejamento do agente do Google Cloud para SAP.

No Linux, o agente do Google Cloud para SAP pode ajudar você a monitorar os processos nos aplicativos SAP e os respectivos estados de ambiente de execução. Isso é fornecido por meio da coleta de métricas do monitoramento de processos, que podem ser ativadas após a instalação do agente nas instâncias de VM do Compute Engine ou nos servidores da Solução Bare Metal.

As informações coletadas nas métricas do Monitoramento de processos ajudam a resolver problemas relacionados ao sistema SAP. Em caso de problemas, com o auxílio das métricas do Monitoramento de processos, o Cloud Customer Care pode ajudar você a achar uma solução com mais eficiência. Os dados coletados usando as métricas do Monitoramento de processos fornecem observabilidade para as configurações de clusters de alta disponibilidade do SAP HANA.

Para informações sobre como configurar o agente do Google Cloud para SAP a fim de coletar as métricas do monitoramento de processos, consulte Configurar a coleta de métricas do monitoramento de processos.

Tipos de métricas do Monitoramento de processos

A partir da versão 2.6 do agente do Google Cloud para SAP, as métricas do monitoramento de processos coletadas pelo agente são chamadas da seguinte maneira:

  • Métricas com mudanças rápidas: isso inclui sap/hana/availability, sap/hana/ha/availability e sap/nw/availability. Essas métricas são coletadas com uma frequência padrão de cinco segundos. Essa frequência de coleta pode ser atualizada usando o parâmetro de configuração process_metrics_frequency.
  • Métricas de mudança lenta: as métricas do monitoramento de processos, exceto as de mudança rápida, são chamadas de mudança lenta. Essas métricas são coletadas com uma frequência padrão de 30 segundos. Essa frequência de coleta pode ser atualizada usando o parâmetro de configuração slow_process_metrics_frequency.

Preços do Cloud Monitoring

As métricas de monitoramento do processo que o agente do Google Cloud para SAP coleta e envia para o Monitoring são classificadas pelo Monitoring como métricas sujeitas à cobrança e preços definidos por volume ingerido.

A frequência com que o agente consulta seus sistemas SAP para coletar as métricas do monitoramento de processos afeta o volume de métricas que são enviadas ao Monitoring.

As métricas do Monitoramento de processos são métricas de mudança rápida e coletadas a cada cinco segundos por padrão.

Para mais informações sobre os preços do Monitoring, consulte Preços de observabilidade do Google Cloud.

Exemplo de estimativa de custo

Para ver uma estimativa de custo de amostra da coleta de métricas do monitoramento de processos usando o agente do Google Cloud para SAP, consulte o Exemplo de preços de métricas cobradas por bytes ingeridos.

Métricas do Monitoramento de Processos

A tabela a seguir descreve as métricas do monitoramento de processos coletadas pelo agente do Google Cloud para SAP. As strings de métricas nesta tabela precisam ser prefixadas com workload.googleapis.com/. Esse prefixo foi omitido das entradas na tabela a seguir.

Métrica Categoria Descrição
sap/hana/service SAP HANA Código de resposta numérica para disponibilidade do serviço SAP HANA.
  • 0: o serviço não está em execução
  • 1: o serviço está em execução
sap/hana/ha/replication SAP HANA Código de resposta numérica para o sistema de replicação SAP HANA, com base no ID do sistema SAP, no número de instância da SAP e no nome do serviço da SAP.
  • 0: ocorreu um erro.
  • 10: sem replicação do sistema (modo independente).
  • 11: ocorreu um erro na conexão.
  • 12: o sistema secundário não se conectou ao sistema principal desde a última reinicialização do sistema principal.
  • 13: a transferência inicial de dados está em andamento. Nesse estado, o sistema secundário não é utilizável.
  • 14: o sistema secundário está sendo sincronizado novamente. Por exemplo, após uma perda temporária de conexão ou a reinicialização do sistema secundário.
  • 15: a inicialização ou a sincronização com o sistema principal foi concluída, e o sistema secundário está continuamente replicando. Não ocorre perda de dados no modo SYNC.
sap/hana/availability SAP HANA Código de resposta numérica para disponibilidade do sistema SAP HANA, com base no ID do sistema e no número de instância do SAP.
  • 0: um ou mais processos não estão ativos.
  • 1: todos os processos estão ativos.
sap/hana/ha/availability SAP HANA Código de resposta numérica para o estado de alta disponibilidade do sistema SAP HANA, com base no ID do sistema e no número da instância do SAP.
  • 0: estado desconhecido
  • 1: o nó atual é secundário
  • 2: o nó principal tem um erro
  • 3: o nó principal está on-line, mas a replicação não está totalmente funcional
  • 4: o nó principal está on-line com a replicação em execução
sap/hana/query/state SAP HANA Código de resposta numérica que representa a verificação de integridade do SAP HANA base na consulta select * from dummy. O valor 0 indica sucesso. Qualquer outro valor indica falhas.
sap/hana/query/overalltime SAP HANA Informado apenas se query/state for 0. Este é o tempo total gasto pela consulta, incluindo o tempo do lado do cliente e do servidor, em microssegundos.
sap/hana/query/servertime SAP HANA Informado apenas se query/state for 0. Esse é o tempo que o servidor leva para processar a consulta, em microssegundos.
sap/cluster/failcounts SAP HANA O valor failcount dos recursos de alta disponibilidade do Linux. Se o recurso não estiver presente, não há contagem de falhas registrada. Caso contrário, o monitoramento de cluster crm_mon informará o número de ações com falha.
sap/cluster/nodes Cluster do Pacemaker Código de resposta numérica que indica o estado do cluster de alta disponibilidade do Linux.
  • -10: desconhecido
  • -1: estado não preparado
  • 0: desligamento
  • 1: espera
  • 2: on-line
sap/cluster/resources Cluster do Pacemaker Código de resposta numérica que indica se o recurso de cluster de alta disponibilidade do Linux está em execução.
  • -10: desconhecido
  • 0: com falha
  • 1: parado
  • 2: iniciando
  • 3: o recurso está em um dos seguintes estados estáveis: Master, Slave ou Started
sap/nw/availability SAP NetWeaver Código de resposta numérica para disponibilidade do sistema SAP, com base no ID do sistema SAP, no número de instância da SAP e no nome do serviço da SAP.
  • 0: estado desconhecido
  • 1: o nó atual está ativo
sap/nw/service SAP NetWeaver Código de resposta numérica para disponibilidade do serviço SAP, com base no ID do sistema SAP, no número de instância SAP e no nome do serviço SAP.
  • 0: o serviço não está em execução
  • 1: o serviço está em execução
sap/nw/icm/rcode SAP NetWeaver Código de resposta baseado no protocolo HTTP 1.1 de um recurso de URL do ICM não autenticado (chamada local).
sap/nw/icm/rtime SAP NetWeaver Tempo de resposta em milissegundos de um recurso de URL ICM não autenticado (chamada local).
sap/nw/ms/rcode SAP NetWeaver Código de resposta baseado no protocolo HTTP 1.1 de um recurso de URL do servidor de mensagens não autenticado (chamada local).
sap/nw/ms/rtime SAP NetWeaver Tempo de resposta em milissegundos de um recurso de URL do servidor de mensagens não autenticado (chamada local).
sap/nw/ms/wp SAP NetWeaver Número de processos de trabalho ABAP (NW ABAP) ou nós do servidor Java (NW Java) relatados pela página de informações do servidor de mensagens.
sap/nw/abap/proc/busy SAP NetWeaver Número de processos de trabalho ABAP ocupados por tipo, como DIA, ICM e DISP.
sap/nw/abap/proc/count SAP NetWeaver Número de todos os processos de trabalho ABAP por tipo, como DIA, ICM e DISP.
sap/nw/abap/queue/current SAP NetWeaver O número atual de filas do ABAP usadas pelos processos de trabalho do ABAP, agrupadas pelos tipos de processo de trabalho, como DIA, ICM e DISP.
sap/nw/abap/queue/peak SAP NetWeaver O número máximo de filas do ABAP usadas pelos processos de trabalho do ABAP, agrupadas pelos tipos de processo de trabalho, como DIA, ICM e DISP.
sap/nw/abap/sessions SAP NetWeaver Número de sessões do ABAP por tipo de sessão.
sap/nw/abap/rfc SAP NetWeaver Número de conexões RFC do ABAP por tipo de sessão.
sap/nw/enq/locks/usercountowner SAP NetWeaver Número de bloqueios de enfileiramento em sistemas SAP NetWeaver. Se o sistema tiver muitas entradas de bloqueio aberto, isso poderá causar problemas de desempenho para os usuários.
sap/mntmode Métricas SAP adicionais Modo de manutenção do ID do sistema SAP (SID) correspondente que foi definido manualmente para indicar que o sistema está intencionalmente inativo (maintenancemode = TRUE). O valor dessa métrica é usado para suprimir os alertas dos sistemas que estão indisponíveis durante a manutenção planejada.

Para notificar o agente se um SID específico estiver passando por uma manutenção planejada, execute o seguinte comando:

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed Métricas SAP adicionais Indica se os serviços do SO relacionados ao SAP e aos serviços de cluster falharam. O código de saída 0 representa uma falha.
sap/service/is-disabled Métricas SAP adicionais Essa métrica é preenchida quando os serviços pacemaker, corosync, sapconf, saptune e sapinit não estão ativados.
sap/hana/cpu/utilization Métricas SAP adicionais Utilização da CPU por processo (%) de processos do SAP HANA.
sap/nw/cpu/utilization Métricas SAP adicionais Utilização da CPU por processo (%) de processos do SAP NetWeaver.
sap/control/cpu/utilization Métricas SAP adicionais Utilização da CPU por processo (%) de processos do SAP Control.
sap/hana/memory/utilization Métricas SAP adicionais Utilização de memória por processo (MB) dos processos do HANA.
sap/nw/memory/utilization Métricas SAP adicionais Utilização de memória por processo (MB) dos processos do NetWeaver.
sap/control/memory/utilization Métricas SAP adicionais Utilização de memória por processo (MB) dos processos SAP Control.
sap/hana/iops/reads Métricas SAP adicionais IOPS de leitura por processo para processos SAP HANA.
sap/hana/iops/writes Métricas SAP adicionais IOPS de gravação por processo para processos do SAP HANA.
sap/nw/iops/reads Métricas SAP adicionais IOPS de leitura por processo para processos do SAP NetWeaver.
sap/nw/iops/writes Métricas SAP adicionais IOPS de gravação por processo para processos do SAP NetWeaver.
sap/infra/migration Métricas de infraestrutura do Google Cloud Indica se uma instância de VM está passando por uma migração em tempo real.
sap/pacemaker Métricas SAP adicionais Código de resposta numérica que informa se o host inclui uma configuração do Pacemaker.
  • 0: nenhuma configuração do Pacemaker encontrada
  • 1: configuração do pacemaker encontrada

Essa métrica tem suporte a partir da versão 3.2 do agente.

sap/hana/volumes Métricas SAP adicionais

Expõe as seguintes informações sobre os volumes montados do SAP HANA: tamanho total do volume, armazenamento usado, armazenamento disponível e porcentagem de uso do armazenamento.

Essa métrica tem suporte a partir da versão 3.2 do agente.

sap/networkstats/rtt Métricas SAP adicionais O tempo médio de retorno, em milissegundos.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

sap/networkstats/rcv_rtt Métricas SAP adicionais O tempo que o cliente remoto leva para esgotar a janela de recebimento remoto divulgado (RWIN, na sigla em inglês) atual se não tiver ocorrido o consumo desses dados do espaço do usuário. Ele se baseia na largura de banda observada da conexão e retorna um valor diferente de zero.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

sap/networkstats/rto Métricas SAP adicionais Tempo limite de retransmissão do TCP em milissegundos.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

sap/networkstats/bytes_acked Métricas SAP adicionais O número de bytes confirmados.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

sap/networkstats/bytes_received Métricas SAP adicionais O número de bytes recebidos.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

sap/networkstats/lastsnd Métricas SAP adicionais O tempo em milissegundos desde o envio do último pacote.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

sap/networkstats/lastrcv Métricas SAP adicionais O tempo em milissegundos desde que o último pacote foi recebido.

Essa métrica contém informações de conexão TCP relacionadas ao seu sistema SAP HANA. Essa métrica é coletada para soquetes do processo hdbnameserver do SAP HANA usando o utilitário ss.

Como visualizar métricas no Monitoring

O Google Cloud fornece painéis personalizados que ajudam a visualizar as métricas do monitoramento de processos coletadas pelo agente do Google Cloud para SAP. Consulte o diretório dashboards/google-cloud-agent-for-sap no repositório GoogleCloudPlatform/monitoring-dashboard-samples do GitHub.

Para informações sobre esses painéis, incluindo instruções de instalação, consulte Acessar as métricas coletadas.

Para informações sobre como encontrar dados de métricas no Monitoring e configurar notificações de alerta, consulte Métricas no Monitoring.