Visão geral do painel de desempenho

O painel de desempenho oferece visibilidade do desempenho de toda a rede do Google Cloud, bem como do desempenho dos recursos do seu projeto.

Com esses recursos de monitoramento de desempenho, é possível distinguir entre um problema no aplicativo e um problema na rede subjacente do Google Cloud. Também é possível depurar problemas históricos de desempenho de rede.

O Painel de desempenho também exporta dados para o Cloud Monitoring. É possível usar o Monitoring para consultar os dados e ter acesso a informações adicionais. Para mais detalhes, consulte a Referência de métricas do Painel de desempenho.

Visualização de desempenho do projeto

Na visualização de desempenho do projeto, o Painel de desempenho mostra métricas de latência ou perda de pacotes somente para zonas em que há instâncias de máquina virtual (VM) do projeto. Por exemplo, tráfego de VM para VM e tráfego de VM para Internet. É possível selecionar até cinco regiões onde as cargas de trabalho são implantadas. O painel permite que você veja e entenda o seguinte:

  • Resumo de perda de pacotes
  • Média de perda de pacotes entre pares de regiões das regiões selecionadas
  • Média de perda de pacotes entre pares de zonas das regiões selecionadas
  • Resumo da latência
  • Mediana de latência entre pares de regiões das regiões selecionadas
  • Mediana de latência entre pares de zonas das regiões selecionadas

Tráfego entre instâncias de VM

O painel de desempenho mostra as métricas de latência e perda de pacotes (em gráficos de resumo e visualizações de mapa de calor) de zonas em que você tem instâncias de máquina virtual (VM) do Compute Engine. Ele fornece dados atuais e métricas das últimas seis semanas. Por exemplo, seu projeto tem uma rede de nuvem privada virtual (VPC, na sigla em inglês) com VMs nas zonas A e B. Nesse caso, o Painel de desempenho fornece métricas de latência e perda de pacotes para o projeto entre essas duas zonas.

Também é possível ver as métricas de latência agregadas de uma amostra do tráfego real de VM para VM em uma visualização tabular, dependendo do período selecionado. A tabela de detalhes de latência lista as VMs e os detalhes de latência correspondentes.

Tráfego entre o Google Cloud e locais da Internet

O Painel de desempenho mostra métricas de latência para regiões em que você tem instâncias de máquina virtual (VM) do Compute Engine e os locais de Internet dos dispositivos finais que se comunicam com as VMs. Ele fornece as métricas de latência atuais e dados históricos de seis semanas. Por exemplo, seu projeto tem uma rede de nuvem privada virtual com VMs na região A que recebe tráfego de clientes nas cidades X e Y. Nesse caso, o Painel de desempenho fornece métricas de latência para o projeto entre a região A e as cidades X e Y.

Para ver as métricas do projeto, clique em Ver o desempenho do projeto na parte superior da página do painel de desempenho. Para mais exemplos e detalhes sobre o que é medido, consulte Métricas.

Visualização de desempenho do Google Cloud

Na visualização de desempenho do Google Cloud, o Painel de desempenho mostra as métricas de latência e perda de pacotes de zona a zona em todo o Google Cloud. Por exemplo, o tráfego de VM para VM e do Google Cloud para a Internet. O painel exibe o status da rede do Google Cloud e permite comparar o desempenho em todo o Google Cloud com o desempenho observado nos seus projetos. É possível selecionar até cinco regiões do Google Cloud para ver e entender o seguinte:

  • Resumo de perda de pacotes. Essa visualização pode mostrar até 50 pares de zonas com perda de pacotes de VM para VM em todo o Google Cloud.
  • Média de perda de pacotes entre pares de zonas.
  • Resumo da latência. Essa visualização pode mostrar até 50 pares de zonas com tempo de retorno (RTT) de VM para VM em todo o Google Cloud.
  • Latência mediana entre pares de zonas.

Tráfego entre instâncias de VM

O painel de desempenho mostra métricas de latência e perda de pacotes em todo o Google Cloud. Essas métricas podem ajudar você a entender se os problemas evidentes no painel por projeto são exclusivos do seu projeto.

A visualização de desempenho do Google Cloud mostra dados de série temporal de até 50 pares de zonas para a janela de tempo selecionada, que por padrão é uma hora.

É possível visualizar o desempenho da rede para qualquer par de zonas do Google Cloud, mesmo que seu projeto não esteja implantado nessas zonas. Veja o desempenho no nível da região e da zona. Um gráfico de série temporal de resumo mostra até 50 pares de zonas com a maior latência ou perda de pacotes agregada de VM para VM em todo o Google Cloud.

Tráfego entre o Google Cloud e locais da Internet

O painel de desempenho mostra métricas de latência entre VMs em todas as regiões do Google Cloud e endpoints da Internet. É possível agregar o tráfego no nível de cidade, região geográfica e país. É possível acessar as métricas de latência que correspondem a pares específicos de local geográfico de região se houver tráfego suficiente do Google Cloud para esse par.

Essas métricas podem ajudar a avaliar se os problemas aparentes no painel por projeto são exclusivos do seu projeto. As métricas globais também podem ajudar você a planejar implantações futuras.

Para visualizar as métricas de desempenho do Google Cloud, clique em Ver o desempenho de todo o Google Cloud na parte superior da página "Painel de desempenho". Para ver as métricas de desempenho do Google Cloud na visualização de desempenho do projeto, mantenha o ponteiro do mouse sobre os pares de zonas específicos. Para mais exemplos e detalhes sobre o que é medido, consulte Métricas.

Métricas

O painel de desempenho fornece dois tipos de métrica: latência e perda de pacotes (tempo de retorno ou RTT). Para ver as métricas de perda de pacotes do projeto, é preciso ter um número suficiente de VMs nele. Para ver as métricas de latência, você precisa de uma quantidade suficiente de tráfego. Fora isso, o painel de desempenho não requer configuração.

As seções a seguir descrevem as duas métricas em mais detalhes.

Perda de pacotes

As métricas de perda de pacotes mostram os resultados da sondagem ativa entre as seguintes informações:

  • VMs em uma única rede VPC.

  • VMs em redes VPC com peering, quando uma ou ambas as redes residem no projeto. Se as redes com peering estiverem em projetos diferentes, a perda de pacotes ficará visível no projeto de destino.

  • VMs em uma rede VPC compartilhada usada pelo projeto. A perda de pacotes entre dois projetos que usam uma rede VPC compartilhada é visível no projeto de serviço de destino.

Por exemplo, suponha que o projeto A inclua duas redes VPC: rede A, que tem VMs apenas na zona A, e rede M, que tem VMs apenas na zona M. Se essas duas redes estiverem em peering, o painel de desempenho do projeto A mostrará os dados de perda de pacotes do par de zonas A/M. Se as redes não estiverem com peering, o Painel de desempenho não mostrará a métrica de perda de pacotes para esse par de zonas.

Por outro lado, suponha que essas duas redes não estejam no mesmo projeto. Ou seja, suponha que a rede A faça parte do projeto A e a rede M faça parte do projeto M. Quando as redes estão em peering, o painel de desempenho do projeto M mostra dados de perda de pacotes para situações em que a zona M é a de destino. Por outro lado, quando a zona A é a zona de destino, os dados de perda de pacotes são visíveis apenas para o projeto A. Se as redes não estiverem em peering, o Painel de desempenho do projeto não mostrará dados de perda de pacotes do par de zonas.

Os dados coletados por todas as sondagens são agregados no painel de desempenho. Ou seja, o Painel de desempenho não permite isolar dados sobre perda de pacotes entre projetos em oposição a outros tipos (como perda de pacotes relacionada a uma rede VPC com peering em outro projeto). No entanto, é possível usar o Monitoring para detalhar e ver os resultados que são mais granulares. Para mais detalhes, consulte a referência de métricas do Painel de desempenho.

O Painel de desempenho não envia sondagens por meio de conexões do Cloud VPN.

Metodologia

O painel de desempenho executa workers nos hosts físicos que hospedam suas VMs. Esses workers inserem e recebem pacotes de sondagem executados na mesma rede do seu tráfego. Como os workers são executados em hosts físicos e não nas VMs, eles não consomem recursos da VM e o tráfego não fica visível nas VMs.

As sondagens cobrem toda a malha de VMs que podem se comunicar, o que não é necessariamente o mesmo que o padrão de tráfego. Portanto, é possível ver indicações da perda de pacotes no painel de desempenho, mas não há evidências de perda de pacotes no aplicativo.

Para todas as VMs de teste, tentamos acessar a VM usando o endereço IP interno e o endereço IP externo, se houver. As sondagens não saem do Google Cloud, mas, com o uso de endereços IP externo, o Painel de desempenho pode cobrir parte do caminho que seria usado pelo tráfego externo, como o tráfego que vem da Internet.

A perda de pacotes para endereços IP internos é medida por meio do uso de pacotes UDP, e a perda de pacotes para endereços IP externos é medida com o uso de pacotes TCP.

Níveis de confiança e disponibilidade de métricas

O Painel de desempenho testa um subconjunto de todos os pares de VM-VM na rede. Os dados coletados são usados para estimar a perda de pacotes que você pode enfrentar. A confiança do Google nos dados depende da taxa de sondagem, e a taxa de sondagem depende do número de VMs que você tem em cada zona, bem como do número de zonas em que as VMs foram implantadas. Por exemplo, ter 10 VMs em duas zonas gera mais confiança do que ter 10 VMs em 10 zonas.

Todas as VMs, incluindo aquelas criadas pelo Google Kubernetes Engine (GKE), são contabilizadas no número total de VMs.

Os diferentes níveis de confiança estão descritos na tabela a seguir. Os níveis inferiores de confiança são sinalizados no mapa de calor com um asterisco (*) ou N/A.

Nível Número necessário de VMs em cada zona O que o painel de desempenho mostra no mapa de calor
Confiança de 95% 10 VMs x o número de zonas no projeto. Por exemplo, se o projeto tem 12 zonas, você precisa ter 120 VMs em cada uma delas. Uma medida sem outras notações
Confiança de 90% 2,5 VMs x o número de zonas no projeto. Por exemplo, se o projeto tem 12 zonas, você precisa ter 30 VMs em cada uma delas. Uma medida sem outras notações
Baixa confiabilidade Uma medida com um asterisco
Sem sondagens suficientes para ter dados significativos N/A

As métricas de perda de pacotes do Google Cloud estão sempre disponíveis. Um asterisco (*) será exibido se houver menos de 400 sondagens por minuto.

Latência específica do projeto

As métricas de latência são medidas usando o tráfego do cliente entre as seguintes opções:

  • VMs em uma única rede VPC
  • VMs entre redes VPC com peering, se as redes estiverem no mesmo projeto.
  • VMs e endpoints da Internet

Além disso, o painel de desempenho de um projeto de serviço em uma rede VPC compartilhada mostra dados apenas para as zonas no projeto de serviço. Ou seja, suponha que uma VM na zona A e o projeto de serviço A use o projeto host para se comunicar com uma VM na zona B e no projeto de serviço B. As medições sobre o tráfego não estão disponíveis para projetos de serviço ou de host.

Latência do Google Cloud

As métricas de latência são medidas usando o tráfego real do cliente entre as seguintes opções:

  • VMs em uma única rede VPC
  • VMs entre redes VPC com peering
  • VMs e endpoints da Internet

Metodologia para latência do projeto e do Google Cloud

A latência é medida com o uso de pacotes TCP.

Com base em uma amostra do seu tráfego real, a latência é calculada como o tempo decorrido entre o envio de um número de sequência TCP (SEQ) e o recebimento de um ACK correspondente que contém o atraso da rede RTT e da pilha TCP. A IU mostra a latência como a mediana de todas as medidas relevantes.

A métrica de latência é baseada na mesma metodologia de origem e amostragem de dados que os registros de fluxo de VPC.

A latência específica do projeto é baseada em amostras do seu projeto. A latência do Google Cloud é baseada em amostras de todo o Google Cloud.

As métricas de latência global são derivadas da amostragem passiva de cabeçalhos de tráfego TCP, e não por meio da sondagem ativa do Google Cloud para endpoints da Internet.

Anomalias de métrica de latência

Observe as seguintes anomalias de métrica de latência:

  • Para ambientes de taxa baixa, o Network Intelligence Center usa sondagens de 60 segundos para métricas de latência. Portanto, as métricas de RTT com base em amostragem de pacotes podem relatar falsos níveis altos de latência quando os serviços baseados em TCP retornam uma resposta de nível de aplicativo atrasada. Geralmente, é possível reconhecer níveis falsos de RTT alto verificando se eles correspondem a atrasos no nível do aplicativo.

    Embora o serviço baseado em TCP responda rapidamente com um ACK, a amostragem perde o ACK e conta uma resposta de dados posterior como o ACK de fechamento para um SEND muito mais antigo, o que distorce a medição geral do RTT. Nesses casos, é possível desconsiderar as métricas de RTT.

  • Às vezes, os dados de latência específicos do projeto não estão alinhados com os dados de latência global. Esse desalinhamento poderá acontecer se o conjunto de dados global também incorporar outros caminhos de rede com latências significativamente diferentes em relação ao caminho de rede usado pelo projeto específico.

Disponibilidade da métrica

A métrica de latência do Google Cloud está sempre disponível. A métrica de latência por projeto estará disponível somente se o tráfego TCP for de cerca de 1.000 pacotes por minuto ou mais.

Tabela de resumo de métricas

A tabela a seguir resume os métodos de sondagem e os protocolos usados para relatar métricas de perda de latência e latência do pacote.

Perda de pacotes Latência
Método de testagem Testagem ativa (tráfego sintético da VM) Testagem passiva (tráfego real da VM)
Protocolo UDP (endereço IP interno), TCP (endereço IP externo) TCP (endereços IP internos/externos)

Visualizações de latência

Os detalhes da latência do tipo de tráfego Internet para Google Cloud estão disponíveis em três visualizações: visualização de Tabela, de Mapa e de linha do tempo.

Visualização em tabela

A visualização Tabela mostra o RTT médio entre as áreas geográficas selecionadas e as regiões que contêm instâncias de VM no seu projeto. A tabela inclui os seguintes detalhes:

  • País: o nome do país.
  • Cidades: o número de cidades. É possível ver os detalhes de latência de cada cidade específica no gráfico de detalhes do país.
  • Regiões de destino: o número de regiões de destino com tráfego de usuários de um determinado país.
  • Latência mediana: o RTT médio entre o país e as regiões em milissegundos.

Visualização de mapa

A visualização Mapa exibe as localizações geográficas (áreas metropolitanas ou cidades) e as regiões do Google Cloud.

  • É possível conferir a latência média de locais específicos e de regiões do Google Cloud.
  • É possível selecionar uma região do Google Cloud e acessar os locais com tráfego para a região selecionada.
  • É possível conferir detalhes específicos do local em um gráfico de latência na barra lateral.
  • Para buscar locais, use a caixa de pesquisa no mapa.
  • Os locais são classificados por cor em diferentes tons de azul para indicar os intervalos de latência média no mapa. Na imagem a seguir, a cor de um círculo que mostra uma determinada cidade em um mapa global pode ser um tom de azul. Quanto mais escuro o tom de azul, maior a latência dessa cidade para uma determinada região do Google Cloud.

    Intervalos de latência mediana no mapa.
    Intervalos de latência mediana no mapa (clique para ampliar).

Visualização da linha do tempo

A visualização Linha do tempo mostra o RTT médio entre as áreas geográficas selecionadas e as regiões do Google Cloud. Ela fornece as métricas de latência atuais e dados históricos de seis semanas. É possível usar os filtros para agregar ainda mais o tráfego aos níveis de cidade, região geográfica e país. Só será possível acessar as métricas de latência correspondentes a pares específicos de local geográfico de região se houver tráfego suficiente do Google Cloud para esse par.

Permissões

Para acessar dados do Painel de desempenho, pelo console do Google Cloud ou pelo Monitoring, é preciso ter a permissão monitoring.timeSeries.list. Essa permissão está incluída nos papéis do Monitoring listados na tabela a seguir.

Nome da função ID do papel
Leitor do Monitoring roles/monitoring.viewer
Editor do Monitoring roles/monitoring.editor
Administrador do Monitoring roles/monitoring.admin

Para informações sobre outros papéis que incluem a permissão monitoring.timeSeries.list, consulte Noções básicas sobre papéis.

Alterar o escopo do projeto

Para usar um escopo de métricas atual e monitorar vários projetos do Google Cloud em uma única visualização, selecione o projeto de escopo usando o seletor de projetos do Console do Google Cloud ou o botão Alterar o escopo. Também é possível selecionar um único projeto de monitoramento usando essas opções. Para mais informações, consulte a referência de métricas do Painel de desempenho.

Você pode criar alertas para alta perda de pacotes com base em condições predefinidas. A política de alertas para perda de pacotes é acionada quando a perda de pacotes excede 5% por cinco minutos para qualquer par de regiões.

O alerta proporciona reconhecimento oportuno de problemas nos seus aplicativos em nuvem para que você possa resolvê-los rapidamente. Uma política de alertas descreve as circunstâncias em que você quer receber alertas e notificações. Para mais informações sobre como criar e gerenciar políticas de alertas, consulte Introdução a alertas.

A seguir