Resolver problemas de monitores sintéticos e verificações de tempo de atividade

Este documento traz informações sobre como encontrar dados de registros solucionar problemas de monitoramento sintético e verificação de tempo de atividade:

.

Encontrar registros

Esta seção fornece informações sobre como encontrar registros para seus monitores sintéticos e verificações de tempo de atividade:

  1. No console do Google Cloud, acesse a página Análise de registros:

    Acessar a Análise de registros

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

  2. Execute um dos seguintes procedimentos:

    • Para encontrar todos os registros associados aos monitores sintéticos ou às verificações de tempo de atividade, a consulta por tipo de recurso. Use o menu Recurso ou insira uma consulta.

      Para verificações de tempo de atividade, no menu Recurso, selecione Uptime Check URL ou insira a seguinte consulta na consulta e clique em Executar consulta:

      resource.type="uptime_url"
      

      Para monitores sintéticos, no menu Recurso, selecione Revisão do Cloud Run ou insira a seguinte consulta na consulta e clique em Executar consulta:

      resource.type="cloud_run_revision"
      
    • Os registros de localização que contêm informações sobre a resposta recebida durante a execução de um monitor sintético ou de verificação de tempo de atividade, realize qualquer uma das seguintes:

      • Para consultar usando o ID do monitor sintético ou da verificação de tempo de atividade, use o seguinte formato ao inserir o ID no Editor de consultas: e depois em Executar consulta

        labels.check_id="my-check-id"
        
      • Consultar registros que contenham dados de resposta para solicitações emitidos por monitores sintéticos e verificações de tempo de atividade, insira a consulta a seguir no editor de consultas e clique em Executar consulta

        "UptimeCheckResult"
        

        A consulta anterior corresponde a todas as entradas de registro que incluem a string "UptimeCheckResult":

      Esses registros incluem o seguinte:

      • O ID do monitor sintético ou da verificação de tempo de atividade, que é armazenado em o campo labels.check_id.

      • Para monitores sintéticos, o nome da função do Cloud, que é armazenado no campo resource.labels.service_name.

      • Quando os dados de trace são coletados, o ID de um trace associado, que é armazenado no campo trace.

    • Para verificar se o serviço recebeu solicitações dos servidores do Google Cloud, copie a consulta a seguir no editor de consultas e depois clique em Executar consulta:

      "GoogleStackdriverMonitoring-UptimeChecks"
      

      O campo protoPayload.ip contém um dos endereços usados pelo de verificação de tempo de atividade. Para mais informações sobre como listar todos os endereços IP endereços IP, consulte Listar endereços IP.

Resolver problemas de notificações

Esta seção descreve alguns erros que podem ocorrer durante a configuração políticas de alertas e fornece informações para resolvê-las.

Você recebeu uma notificação e quer depurar a falha

  1. Para identificar quando a falha começou, siga um destes procedimentos:

    • Nas verificações de tempo de atividade, para determinar quando a falha ocorreu, visualizar a página Detalhes do tempo de atividade:

      1. No console do Google Cloud, acesse a página  Verificações de tempo de atividade:

        Acesse Verificações de tempo de atividade

        Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.

      2. Encontre e selecione a verificação de tempo de atividade.

        O gráfico Verificações aprovadas mostra o histórico de verificações. Para identificar quando a verificação de tempo de atividade falhou pela primeira vez, pode ser necessário modificar o intervalo de tempo do gráfico. O seletor de intervalo de tempo localizado na barra de ferramentas da página Detalhes do tempo de atividade.

    • Para monitores sintéticos, para determinar quando a falha ocorreu, visualizar a página Detalhes do tempo de atividade:

      1. No console do Google Cloud, acesse Página  Monitoramento sintético:

        Acesse Monitoramento sintético

        Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.

      2. Encontre e selecione o monitor sintético.
  2. Para saber como encontrar dados de registros associados, consulte a seção desta página intitulada Registros de descobertas.

Você não vai receber uma notificação de que uma verificação de tempo de atividade falhou

Você configurou uma verificação de tempo de atividade e está acessando a página Detalhes do tempo de atividade de essa verificação. Observe que o gráfico Verificações aprovadas mostra que pelo menos um do verificador falhou. No entanto, você não recebeu uma notificação.

Por padrão, a política de alertas é configurada para criar um incidente uma notificação quando os verificadores em pelo menos duas regiões não receberem uma resposta verificação de tempo de atividade. Essas falhas precisam ocorrer simultaneamente.

É possível editar a condição da política de alertas para receber uma notificação quando uma única região não recebe uma resposta. No entanto, recomendamos que você a usar a configuração padrão, o que reduz o número de notificações que que você pode receber devido a falhas temporárias.

Para visualizar ou editar uma política de alertas, faça o seguinte:

  1. No console do Google Cloud, acesse a página  Alertas:

    Acessar Alertas

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.

  2. Clique em Ver todas as políticas no painel Políticas.
  3. Encontre a política que você quer ver ou editar e clique no botão nome da política.

    É possível consultar e editar a política na página Detalhes da política.

Resolver problemas de verificações de tempo de atividade públicas

Esta seção descreve alguns erros que você pode encontrar ao usar verificações de tempo de atividade públicas e fornece informações para resolvê-las.

Suas verificações de tempo de atividade públicas estão falhando

Você configura uma verificação de tempo de atividade pública, mas recebe um erro ao realize a etapa de verificação.

Veja a seguir algumas possíveis causas de falha na verificação de tempo de atividade:

  • Connection Error - Refused: se você usa o tipo de conexão padrão HTTP, verifique se há um servidor da Web instalado que esteja respondendo a solicitações HTTP. Pode ocorrer um erro de conexão em uma nova instância se não tiver instalado um servidor da Web. consulte Guia de início rápido do Compute Engine. Se você usa um tipo de conexão HTTPS, talvez tenha que executar mais algumas etapas de configuração. Para problemas de firewall, consulte Listar endereços IP do servidor de verificação de tempo de atividade.
  • Nome ou serviço não encontrado: o nome do host pode estar incorreto.
  • 403 Proibido: o serviço está retornando um código de erro para o verificador de tempo de atividade. Por exemplo, a configuração do servidor da Web Apache padrão retorna esse código no Amazon Linux, mas retorna 200 (Success) em algumas outras versões do Linux. Consulte o Tutorial de LAMP para Amazon Linux (em inglês) ou a documentação do servidor da Web.
  • 404 Não encontrado: o caminho pode estar incorreto.
  • 408 Request timeout ou sem resposta: o número da porta pode estar incorreto, o serviço pode não estar em execução ou estar inacessível, ou o tempo limite pode estar muito baixo. Verifique se o firewall permite o tráfego dos servidores de tempo de atividade, ver Listar endereços IP do servidor de verificação de tempo de atividade. O tempo limite é especificado como parte das opções de Validação de resposta.

Para ajudar a resolver problemas de verificações de tempo de atividade públicas com falha, configure as verificações de tempo de atividade para enviar até três Pings ICMP durante a verificação. Os pings ajudam a distinguir por exemplo, problemas de conectividade de rede e de tempo limite no aplicativo. Para mais informações, consulte Use pings ICMP.

Resolver problemas de verificações de tempo de atividade particulares

Esta seção descreve alguns erros que você pode encontrar ao usar verificações de tempo de atividade particulares e fornece informações para resolvê-las.

Falha na criação de verificação de tempo de atividade

As configurações do seu projeto do Google Cloud podem impedir a modificação dos papéis atribuídos à conta de serviço que as verificações de tempo de atividade usam para gerenciar interações com o serviço do Diretório de serviços. Nessa situação, a criação da verificação de tempo de atividade falha.

Nesta seção, descrevemos como conceder os papéis aos quais a conta de serviço requer:

Console do Google Cloud

Ao usar o console do Google Cloud para criar a verificação de tempo de atividade particular, o console do Google Cloud emite os comandos para conceder do Diretório de serviços à conta de serviço.

Para mais informações sobre como conceder papéis a uma conta de serviço, consulte Autorizar a conta de serviço.

API: projeto do escopo

Na primeira vez que você cria uma verificação de tempo de atividade particular para um Serviços e recursos privados do Diretório de serviços em um único projeto do Google Cloud, a solicitação poderá ser bem-sucedida ou não. O resultado depende de você desativaram as concessões automáticas de papéis para contas de serviço; no seu projeto:

  • A primeira criação da verificação de tempo de atividade é bem-sucedida se o projeto permitir concessões automáticas de papéis para contas de serviço. Uma conta de serviço é criado para você e recebe os papéis necessários.

  • A primeira criação da verificação de tempo de atividade vai falhar se o projeto não permitir concessões automáticas de papéis para contas de serviço. Uma conta de serviço é é criado, mas nenhum papel é concedido.

Se a criação da verificação de tempo de atividade falhar, faça o seguinte:

  1. Autorize a conta de serviço.
  2. Aguarde alguns minutos até que as permissões sejam propagadas.
  3. Tente criar a verificação de tempo de atividade particular novamente.

API: projeto monitorado

Na primeira vez que você cria uma verificação de tempo de atividade privada que tem como alvo uma serviço do Diretório de serviços em um projeto monitorado ou recursos particulares em diferentes projetos do Google Cloud, a solicitação falha e resulta na criação conta de serviço do Monitoring.

A forma como você autoriza a conta de serviço depende do número de Os projetos do Google Cloud que você usa e as relações deles. É possível ter até quatro projetos envolvidos:

  • O projeto em que você definiu a verificação de tempo de atividade particular.
  • O projeto monitorado em que você configurou o Diretório de serviços.
  • O projeto em que você configurou a rede VPC.
  • O projeto em que os recursos de rede, como VMs ou balanceadores de carga, configurada. Este projeto não tem papel na autorização da conta de serviço discutidos aqui.

Quando a criação da primeira verificação de tempo de atividade falhar, faça o seguinte:

  1. Autorize a conta de serviço.
  2. Aguarde alguns minutos até que as permissões sejam propagadas.
  3. Tente criar a verificação de tempo de atividade particular novamente.

Acesso negado

Suas verificações de tempo de atividade estão falhando e gerando VPC_ACCESS_DENIED resultados. Este resultado significa que algum aspecto da configuração de rede ou da conta de serviço autorização não está correta.

Verifique a autorização da sua conta de serviço para usar um escopo ou um projeto monitorado, conforme descrito Falha na criação da verificação de tempo de atividade.

Para mais informações sobre como acessar redes privadas, consulte Configure o projeto de rede.

Resultados anômalos de verificações de tempo de atividade particulares

Você tem um serviço do Diretório de serviços com várias VMs e a configuração de serviço contém vários endpoints. Quando você encerra uma das VMs, a verificação de tempo de atividade ainda indica sucesso.

Quando a configuração de serviço contém vários endpoints, um é escolhidos aleatoriamente. Se a VM associada ao endpoint escolhido estiver em execução, A verificação de tempo de atividade é concluída mesmo que uma das VMs esteja inativa.

Cabeçalhos padrão

As verificações de tempo de atividade estão retornando erros ou resultados inesperados. Isso pode se você tiver substituído os valores padrão do cabeçalho.

Quando uma solicitação de verificação de tempo de atividade particular é enviada para um endpoint de destino, a solicitação inclui os seguintes cabeçalhos e valores:

Cabeçalho Valor
HTTP_USER_AGENT GoogleStackdriverMonitoring-UptimeChecks(https://cloud.google.com/monitoring)
HTTP_CONNECTION keep-alive
HTTP_HOST IP do endpoint do Diretório de serviços
HTTP_ACCEPT_ENCODING gzip, deflate, br
CONTENT_LENGTH Calculado com base nos dados da postagem de tempo de atividade

Se você tentar substituir esses valores, o seguinte poderá acontecer:

  • A verificação de tempo de atividade informa erros
  • Os valores de substituição são descartados e substituídos pelos valores na tabela

Nenhum dado visível

Você não vê dados no painel de verificação de tempo de atividade quando seu a verificação de tempo de atividade está em um projeto do Google Cloud diferente Diretório de serviços.

Confirme se o projeto do Google Cloud que contém a verificação de tempo de atividade monitora o projeto do Google Cloud que contém as Diretório de serviços.

Para mais informações sobre como listar projetos monitorados e adicionar algumas, consulte Configurar um escopo de métricas para vários projetos.

Resolver problemas de monitores sintéticos

Esta seção fornece informações que podem ser usadas para ajudar na solução de problemas seus monitores sintéticos.

Mensagem de erro após ativar as APIs

Você abre o fluxo de criação de um monitor sintético e precisa ativar ter pelo menos uma API. Depois de ativar as APIs, uma mensagem semelhante à seguinte é exibido:

An error occurred during fetching available regions: Cloud Functions API has
not been used in project PROJECT_ID before or it is disabled.

A mensagem de erro recomenda que você verifique se a API está ativada e, em seguida, aconselha que você aguarde e tente realizar a ação novamente.

Para verificar se a API está ativada, acesse a página APIs e Serviços do seu projeto:

Acessar APIs e serviços

Depois de confirmar que a API está ativada, você pode continuar com a fluxo de criação. A condição é resolvida automaticamente depois que a API se propaga pelo back-end.

As solicitações HTTP de saída não estão sendo rastreadas

Configure seu monitor sintético para coletar dados de rastreamento para saída solicitações HTTP. Seus dados de trace mostram apenas um período, semelhante ao seguinte captura de tela:

Cloud Trace exibindo apenas um trace.

Para resolver essa situação, verifique se sua conta de serviço recebeu o papel de Agente do Cloud Trace (roles/cloudtrace.agent). Um papel de Editor (roles/editor) também é suficiente.

Para ver os papéis concedidos à conta de serviço, faça o seguinte:

  1. No console do Google Cloud, abra a página IAM.

    Acesse o IAM

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo IAM e administrador.

  2. Selecione Incluir concessões de papel fornecidas pelo Google.
  3. Se a conta de serviço usada pelo monitor sintético não estiver listada ou se ela não recebeu um papel que inclua as permissões na função de Agente do Cloud Trace (roles/cloudtrace.agent) e depois conceda esse papel ao conta de serviço.

    Se você não souber o nome da sua conta de serviço, no menu de navegação selecione Contas de serviço.

Status em andamento

A página Monitores sintéticos lista um monitor sintético com um status In progress. O status In progress significa que o monitor sintético foi criado recentemente e não há dados para exibir, ou que houve falha na implantação da função.

Para determinar se a implantação da função falhou, tente o seguinte:

  • Verifique se o nome da função do Cloud conter um sublinhado. Se houver um sublinhado, remova-o e reimplantar a função do Cloud.

  • Abra a página Detalhes do monitor sintético no monitor.

    Se a mensagem a seguir aparecer, exclua o monitor sintético.

    Cloud Function not found for this Synthetic monitor. Please confirm it exists or delete this monitor.
    

    A mensagem de erro indica que a função foi excluída e, portanto, o monitor sintético não pode executar a função.

  • Abra a página do Cloud Functions para a função. Para abrir esta página Na página Detalhes do monitor sintético, clique em Código e selecione clique no nome da função.

    Se aparecer uma mensagem semelhante à seguinte, isso significa que a função falhou implantar.

    This function has failed to deploy and will not work correctly. Please edit and redeploy
    

    Para resolver essa falha, revise o código da função e corrija os erros que impedem a criação ou implantação da função.

Quando você cria um monitor sintético, pode levar alguns minutos para que o a ser implantada e executada.

Status de alerta

Os monitores sintéticos listam um monitor sintético. com um status Warning. O status Warning significa que a execução e os resultados forem inconsistentes. Isso pode indicar um problema de design da teste, ou pode indicar que o que está sendo testado tem um comportamento inconsistente.

Status de falha

Os Monitores sintéticos listam os monitores sintéticos com o status Failing Para saber mais sobre o motivo da falha, exibir o histórico de execução mais recente.

  • Se a mensagem de erro Request failed with status code 429 for exibida, o alvo da solicitação HTTP rejeitou o comando. Para resolver isso, altere o destino do monitor sintético.

    O endpoint https://www.google.com rejeita solicitações feitas por monitores sintéticos.

  • Se a falha estiver retornando um tempo de execução de 0ms, então o A função do Cloud pode estar ficando sem memória. Para resolver isso, de configuração, edite a função do Cloud e aumente a memória como pelo menos 2 GiB e defina o campo "CPU" como 1.

Falha na exclusão de um monitor sintético

Você usa a API Cloud Monitoring para excluir um monitor sintético, mas a API falha com uma resposta semelhante à seguinte:

{
  "error": {
    "code": 400,
    "message": "Request contains an invalid argument.",
    "status": "INVALID_ARGUMENT",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.DebugInfo",
        "detail": "[ORIGINAL ERROR] generic::invalid_argument: Cannot delete check 1228258045726183344. One or more alerting policies is using it.Delete the alerting policy with id projects/myproject/alertPolicies/16594654141392976482 and any other policies using this uptime check and try again."
      }
    ]
  }
}

Para resolver a falha, exclua as políticas de alerta que monitorar os resultados e excluir o monitor sintético.

Não foi possível editar a configuração de um verificador de links corrompidos

Você criou um verificador de links corrompidos usando o console do Google Cloud e quer para alterar os elementos HTML que são testados ou que você deseja modificar o tempo limite do URI, novas tentativas, espera pelo seletor e opções por link. No entanto, quando você edita o verificador de links corrompidos, o console do Google Cloud não exibir os campos de configuração.

Para resolver essa falha, faça o seguinte:

  1. No console do Google Cloud, acesse Página  Monitoramento sintético:

    Acesse Monitoramento sintético

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoramento.

  2. Localize o monitor sintético que você quer editar. Clique em Mais opções e selecione Editar.
  3. Clique em Editar função.
  4. Edite o objeto options no arquivo index.js e, em seguida, Clique em Aplicar função.

    Para obter informações sobre os campos e a sintaxe desse objeto, consulte broken-links-ok/index.js.

  5. Clique em Salvar.

Telas do console do Google Cloud que falham ao salvar capturas de tela

Você criou um verificador de links corrompidos e o configurou para salvar capturas de tela. No entanto, o console do Google Cloud está exibindo um dos seguintes avisos: junto com informações mais detalhadas:

  • InvalidStorageLocation
  • StorageValidationError
  • BucketCreationError
  • ScreenshotFileUploadError

Para resolver essas falhas, tente o seguinte:

  • Se você vir a mensagem InvalidStorageLocation, verifique a existência do bucket do Cloud Storage especificado no campo options.screenshot_options.storage_location.

  • Veja os registros relacionados à função do Cloud. Para mais informações, consulte Como encontrar registros.

  • Verifique se a conta de serviço usada O função do Cloud tem um papel do Identity and Access Management que permite criar, acesso e gravação nos buckets do Cloud Storage.