Resolver problemas de observabilidade do SAP

Este documento descreve como resolver problemas que podem ser encontrados ao usar o serviço de observabilidade para cargas de trabalho da SAP no Workload Manager.

O ID do sistema SAP não está listado no painel de observabilidade

Depois de configurar o agente do Google Cloudpara SAP para a observabilidade e conceder as permissões necessárias às contas de serviço para todas as VMs que hospedam os diferentes elementos de um sistema SAP (como serviços centrais, servidores de aplicativos e bancos de dados SAP HANA), o ID do sistema aparece no painel de observabilidade do SAP. Se o ID do sistema não estiver listado, verifique a configuração e os registros do agente, conforme explicado nas seções a seguir.

Verificar a configuração do agente

Verifique se todos os recursos necessários estão configurados corretamente para o agente do Google Cloudpara SAP.

Para conferir o status dos recursos da instância do agente, execute o seguinte comando:

sudo /usr/bin/google_cloud_sap_agent configure -showall

A resposta ao comando será assim:

   host_metrics [ENABLED] 
workload_evaluation [ENABLED]
process_metrics [ENABLED]
sap_discovery [ENABLED]
workload_discovery [ENABLED]
hana_monitoring [DISABLED] or hana_monitoring [ENABLED]
agent_metrics [DISABLED]

Se um ou mais recursos estiverem listados como [DISABLED], configure o agente e ative esses recursos.

Verificar os registros da instância da VM

Nos registros da instância da VM, confira os problemas relacionados ao agente do SAP que não consegue atualizar as informações do sistema SAP. Para conferir os registros, faça o seguinte:

  1. Selecione uma VM para abrir a página Detalhes.
  2. Clique na guia Observabilidade para exibir informações sobre a VM.
  3. Selecione Todos os registros e classifique por Gravidade.

    Guia "Observabilidade da VM"

    A maioria desses erros está relacionada à falta de permissões para a conta de serviço anexada à VM. Para resolver esses erros, conceda as permissões necessárias à conta de serviço.

Verificar registros usando o Cloud Logging

É necessário garantir que o agente para SAP descubra as cargas de trabalho do SAP corretamente. Para conferir as entradas de registro da instância de VM que hospeda o agente, faça o seguinte:

  1. No console do Google Cloud, selecione Logging e Análise de registros:

    Acesse o Explorador de registros

  2. No painel Consulta, selecione Mostrar consulta e insira a seguinte consulta:

    jsonPayload.@type:"SapDiscovery"
    

    Se você não conseguir acessar nenhuma informação das VMs que hospedam o agente, ele pode não estar configurado ou funcionando corretamente. Para mais informações, consulte Configurar o agente para SAP.

  3. Opcional: para conferir os registros relacionados ao processo quando o agente para SAP faz o upload dos dados de descoberta do SAP, use a seguinte consulta:

     -jsonPayload.caller=~"third_party/sapagent/internal/system/clouddiscovery/cloud_discovery.go"
     -jsonPayload.caller=~"third_party/sapagent/internal/system/sapdiscovery"
    

O status de integridade aparece como não especificado

Pode haver várias causas para o status de integridade Não especificado (cor cinza) do sistema SAP. Esse status de integridade é usado para identificar sistemas que não podem ser avaliados corretamente pelo Workload Manager devido à falta de métricas ou configurações. As causas mais comuns para esse status de integridade são as seguintes:

  • O agente do Google Cloudpara SAP pode ser interrompido ou informar incorretamente as métricas necessárias. Para mais informações, consulte Validar a instalação do agente.

  • Se o agente para SAP estiver em funcionamento e o status do sistema for Não especificado, verifique se os recursos de Monitoramento de processo e Monitoramento do SAP HANA estão ativados e configurados corretamente no agente, dependendo dos processos do SAP em execução na VM. Os serviços centrais e os servidores de aplicativos exigem que o monitoramento de processo seja ativado, enquanto os bancos de dados do SAP HANA exigem que o monitoramento de processo e do SAP HANA sejam ativados.

    • Os valores padrão para a frequência de coleta das métricas do Monitoramento de processos com mudanças rápidas e lentas são 5 e 30 segundos, respectivamente. Se esses valores forem aumentados acima dos valores padrão, o status de integridade poderá ser Não especificado.
  • Na página "Visão geral do sistema", verifique se a arquitetura e o tipo de escala estão identificados corretamente para seu sistema. Se um ou ambos esses parâmetros estiver(em) incorreto(s), há um problema com o agente doGoogle Cloudpara SAP ou com os dados SAP enviados para Google Cloud. Para mais análises, entre em contato com o Cloud Customer Care. Consulte Como receber suporte para o agente do Google Cloudpara SAP.

  • Os papéis de cada VM relacionada ao sistema não são identificados corretamente devido às métricas workload/sap/nw/instance/role ou workload/sap/hana/ha/availability não funcionarem corretamente ou estarem ausentes. Verifique as funções SAP identificadas na lista de VMs nos painéis de Aplicativos e Bancos de Dados.

    Os seguintes papéis são necessários para cada um dos tipos de arquitetura:

    • Arquitetura centralizada: serviços centrais, servidor de aplicativos e SAP HANA principal.
    • Arquitetura distribuída: serviços centrais, servidor de aplicativos e SAP HANA principal.
    • Distribuído com HA: serviços centrais, ERC, servidor de aplicativos, SAP HANA principal e SAP HANA secundário.

    Todas as VMs na lista precisam ter uma função atribuída.

  • Verifique se as métricas necessárias têm um valor válido verificando a métrica no Cloud Monitoring ou usando o método da API timeSeries para ter o valor mais recente enviado pelo agente para SAP. Se a métrica não estiver presente no Cloud Monitoring ou não tiver valor, o status de integridade será marcado como Não especificado porque não há dados suficientes para avaliar essa métrica.

  • Em arquiteturas distribuídas com HA, verifique se há uma ação com falha no cluster e execute uma limpeza executando os seguintes comandos:

    RHEL

    pcs resource cleanup RESOURCE_ID

    SLES

    crm resource cleanup RESOURCE_ID

    Substitua RESOURCE_ID pelo ID do recurso com falha no cluster.

    Uma ação com falha no cluster pode afetar as métricas workload.googleapis.com/sap/cluster/nodes e workload.googleapis.com/sap/cluster/resources e informar valores incorretos.

  • Verifique se a versão do Agente para SAP do Google Cloudestá atualizada e se você está executando a versão mais recente disponível. As versões mais recentes do agente contêm correções de problemas e bugs relacionados às métricas de observabilidade. Métricas incorretas podem resultar no status de integridade Não especificado do sistema.

  • Para bancos de dados SAP HANA replicados para um site secundário, verifique se há uma configuração de cluster válida entre o principal e o secundário.