Como identificar eventos de manutenção do roteador

O Cloud Router usa o order Gateway Protocol (BGP) para trocar rotas entre sua rede de nuvem privada virtual (VPC, na sigla em inglês) e a rede local. O Google Cloud realiza periodicamente manutenções de software e reinícios de tarefas automatizadas. Durante a manutenção, os roteadores locais normalmente registram um evento de desativação do BGP seguido por um evento do BGP (coletivamente, uma flap do BGP).

Como identificar eventos usando a mensagem de tarefa do roteador ativada

No Console do Google Cloud, a seguinte mensagem é exibida: Evento do Router: tarefa do Router ativada. Essa mensagem indica que uma tarefa do Cloud Router foi iniciada para um Cloud Router específico e está pronta para estabelecer sessões de BGP. Essa mensagem aparece nos registros na primeira vez que um Cloud Router é criado e, posteriormente, sempre que o Cloud Router passa por manutenção.

A mensagem Tarefa do roteador ativada indica que houve um evento do Cloud Router durante o período/problema. Esse evento pode ser causado pela migração, reinicialização ou upgrade de uma tarefa do Cloud Router. As tarefas do Cloud Router são processos de software no plano de controle do Google Cloud que normalmente são migrados de máquina em máquina. Durante essas migrações, o Cloud Router talvez fique inativo por alguns segundos. Como essas migrações são feitas fora do plano de dados, as migrações normais não fazem com que o tráfego fique inativo.

Como identificar eventos usando uma métrica com base em registros

Console

  1. No Console do Google Cloud, acesse a página do Cloud Routers.

    Acesse o Cloud Routers

  2. Selecione o Cloud Router na lista de Cloud Routers.

  3. Na coluna Registros, clique em Visualizar.

    A consulta padrão é exibida no Criador de consultas.

  4. Na consulta padrão, anote o valor do ID do roteador da variável resource.labels.router_id.

  5. Crie uma nova consulta usando o valor resource.labels.router_id da consulta anterior da seguinte maneira:

    resource.labels.router_id=ROUTER_ID
    textPayload=~"Router task activated"
    
  6. Crie um alerta com uma notificação de um evento de manutenção usando a consulta anterior.

    Essa notificação é exibida na primeira vez que o roteador é criado e, posteriormente, durante cada evento de manutenção.

    Para mais informações sobre como criar um alerta, consulte Como criar uma política de alertas em uma métrica de contador.

Como verificar a conectividade entre o roteador local e o Cloud Router

Para garantir que a oscilação de BGP não seja causado pela conexão perdida entre o roteador local e o Cloud Router, é possível verificar a conectividade usando os seguintes métodos:

  • Para o Cloud Router usado com o Cloud VPN, configure um painel para network/received_packets_count e network/sent_packets_count para monitorar qualquer perda de conectividade. Para mais informações, consulte Como visualizar métricas de VPN.
  • Para o Cloud Router usado com o Cloud Interconnect, configure um painel para network/attachment/sent_packets_count e network/attachment/received_packets_count para monitorar a conectividade dos anexos da VLAN. Para mais informações, consulte Métricas do Interconnect.

Durante os eventos de manutenção do Cloud Router, o painel não deve mostrar nenhuma lacuna de conectividade alinhada aos eventos. Se houver uma correlação entre os eventos de manutenção e a perda de pacotes, abra um tíquete no suporte do Google Cloud para realizar uma investigação mais detalhada.

A seguir