Visão geral do Painel de Desempenho

O Painel de Desempenho fornece visibilidade do desempenho da sua rede da nuvem privada virtual (VPC, na sigla em inglês). Ele fornece métricas de perda de pacotes (disponibilidade) e latência (tempo de retorno (RTT, na sigla em inglês)) entre as zonas nas quais você tem VMs. O Painel de Desempenho fornece gráficos de resumo e exibições de mapa de calor rapidamente para perda e latência agregada de pacotes de VM para VM (RTT) entre zonas. Você pode visualizar valores históricos das seis semanas anteriores. Você também pode consultar essas métricas por meio do Cloud Monitoring.

Com esses recursos de monitoramento de desempenho de rede, você pode distinguir rapidamente entre um problema em seu aplicativo e um problema na rede subjacente do Google Cloud e depurar facilmente problemas históricos de desempenho de rede.

Métrica

O Painel de desempenho fornece dois tipos de métricas: métricas de perda de pacotes e métricas de latência. Ambas as métricas são medidas para endereços IP internos e externos. A perda de pacotes para endereços IP internos é medida usando pacotes UDP, e a perda de pacotes para endereços IP externos é medida usando pacotes TCP. As métricas de latência são todas baseadas em TCP.

As métricas do Painel de Desempenho são coletadas automaticamente para todas as zonas em um projeto em que você tenha VMs. O Painel de Desempenho não requer configuração manual ou instalação manual de sondagens. No entanto, você precisa de VMs suficientes no projeto para conseguir métricas de perda de pacotes e tráfego suficiente para conseguir métricas de latência.

Todas as VMs, incluindo aquelas criadas pelo GKE, contam para o número total de VMs no projeto.

Métrica de perda de pacotes

Mostra os resultados da análise ativa entre suas VMs em uma determinada rede de nuvem privada virtual. O Painel de Desempenho executa workers nos hosts físicos que hospedam suas VMs. Esses workers inserem e recebem pacotes de sondagens executados na mesma rede que o tráfego, revelando problemas nessa rede. Como os workers são executados no host físico e não na sua VM, esses workers não consomem recursos da VM e o tráfego não é visível nas VMs. A perda de pacotes é agregada para todos os pares de zonas.

Existem três níveis possíveis de confiança para uma medição de perda de pacotes, dependendo do número de sondagens. O número de sondagens é proporcional ao número de VMs. Se o número suficiente de sondagens por minuto for atendido, o valor exibido terá uma confiança de 90% ou mais. Se o número de sondagens por minuto não for suficiente para 90% de confiança, mas acima do mínimo, o mapa de calor exibirá um asterisco (*) ao lado do valor. Se o número mínimo de sondagens não for atendido, o mapa de calor mostra NA.

A perda de pacotes é medida por sondagens em um subconjunto da rede para estimar a perda de pacotes que você pode ter na mesma rede. A taxa de sondagem depende do número de VMs por zona e nossa confiança nos dados depende da taxa de sondagem. Para que os dados do Painel de Desempenho sejam confiáveis com 95% de confiança (o maior erro provável é de 5%), em cada zona você precisa ter 10 VMs * o número de zonas no projeto. (Se você tiver 12 zonas em seu projeto, precisará ter 120 VMs em cada zona para conseguir 90% de confiança na métrica de perda de pacotes.) Para 90% de confiança, basta ter 2,5 VMs x o número de zonas no projeto em execução em cada zona. (Para 12 zonas, você precisa ter 30 VMs em cada zona.) O Painel de desempenho mostrará um "*" se tivermos pouca confiança devido a um número menor de sondagens. Ele mostrará NA se houver muito poucas sondagens para ter confiança.

A perda de pacotes entre dois projetos usando a VPC compartilhada é medida em relação ao projeto de serviço de destino.

As sondagens cobrem toda a malha de VMs que podem se comunicar, o que não é necessariamente o mesmo que o padrão de tráfego. Portanto, você pode ver indicações de perda de pacotes no painel, mas nenhuma evidência de perda de pacotes no seu aplicativo.

Métrica de latência

Com base em uma amostra do seu tráfego de VM da TCP real, essa métrica é semelhante ao método de amostragem usado para Registros de Fluxo da VPC. A latência é calculada como o tempo decorrido entre o envio de um número de sequência TCP (SEQ) e o recebimento de um ACK correspondente que contém o atraso relacionado à rede RTT e à pilha TCP. A interface do usuário mostra a latência como a mediana de todas as medidas relevantes.

A métrica de latência estará disponível apenas se o tráfego TCP estiver em torno de 1000 pacotes por minuto ou mais.

Tabela de resumo de métricas

Esta tabela resume o método e o protocolo de análise usados para relatar métricas de perda e latência de pacotes.

Perda de pacotes Latência
Método de sondagem Sondagem ativa (tráfego sintético da VM) Sondagem passiva (tráfego real da VM)
Protocolo UDP (IP interno), TCP (IP externo) TCP (IP interno/externo)

Casos de uso

Diagnóstico de desempenho atual: é a rede ou o aplicativo?

O Painel de desempenho fornece visibilidade ao vivo do desempenho da sua rede VPC, ajudando a determinar se os problemas de aplicativos são resultado de problemas de software ou de rede. Se houver perda significativa de pacotes ou alta latência, é possível que um problema de rede do Google Cloud seja pelo menos parte do problema. Se a perda e a latência de pacotes parecerem normais, é provável que haja um problema com o aplicativo.

Investigar um problema que está acontecendo agora

Cenário: você abre o Painel de Desempenho e vê um grande aumento no gráfico Resumo de perdas de pacotes na última hora. Como esse gráfico resume a perda de pacotes em todas as zonas, você ainda não sabe onde ocorreu a perda de pacotes.

Perda de pacotes atual (clique para ampliar)
Perda de pacote atual (clique para ampliar)

Para investigar mais, clique na hora em que ocorreu o pico para visualizar um mapa de calor de pares de zonas. Você pode ajustar exatamente a que horas está visualizando arrastando o seletor no eixo do tempo do gráfico de resumo.

Clicar em um horário para ver os detalhes desse horário (clique para ampliar)
Clicar em um horário para ver detalhes desse horário (clique para ampliar)

O mapa de calor mostra os dados para o tempo que você selecionou no gráfico de resumo. Os quadrados do mapa de calor são codificados por cores com base na legenda à esquerda do mapa de calor. Cada cor reflete uma porcentagem diferente de perda de pacotes de uma zona para a outra.

Mapa de calor de perda de pacotes por um tempo específico (clique para ampliar)
Mapa de calor da perda de pacotes por um tempo específico (clique para ampliar)

A perda de pacotes é medida em cada direção. Portanto, um quadrado que mostra a perda de pacotes indica perda de pacotes da zona indicada no eixo de origem para a zona indicada no eixo de destino. Cada quadrado no mapa de calor também exibe um valor percentual para perda de pacotes.

Você clica no quadrado roxo da zona de origem us-central1-a até a zona de destino us-east1-b para ver um gráfico especificamente para esse par de zonas. O gráfico de detalhes mantém sua seleção de tempo da página anterior, mostrando o alfinete azul.

Perda de pacotes para um período selecionado (clique para ampliar)
Perda de pacote para um período de tempo selecionado (clique para ampliar)

Você vê duas linhas no gráfico, uma para cada direção do fluxo de dados. Neste exemplo, a linha roxa mostra a perda de pacotes para o tráfego da zona de origem us-central1-a para a zona de destino us-east1-b. Uma linha vermelha mostra a direção reversa, da origem zone us-east1-b até a zona de destino us-central1-a.

O gráfico mostra que esse aumento na perda de pacotes é um erro externo. Se quiser, você pode alterar a janela de tempo dos dados exibidos para esse par de zonas clicando no seletor de horário no canto superior direito. Você pode visualizar até 6 semanas de dados. Neste exemplo, você clica em 7 dias para ver a tendência de perda de pacotes para o par de zonas selecionado.

Perda de pacotes por um período de 7 dias (clique para ampliar)
Perda de pacote por um período de 7 dias (clique para ampliar)

Diagnóstico de desempenho histórico

Investigar um problema no passado recente

Você está investigando um problema com latência que aconteceu no início desta semana. Você usa os dados históricos de desempenho no Painel de Desempenho para examinar a zona em questão.

Você clica na guia Latência para alterar a exibição.

Guia Latência (clique para ampliar)
Guia Latência (clique para ampliar)

Você usa o seletor de hora no canto superior direito para ajustar a janela de hora do gráfico Resumo da latência. Neste exemplo, ele está definido como 1 hora. Você clica em uma hora no eixo de tempo do gráfico para ver o mapa de calor da latência naquele momento.

Selecionar uma hora (clique para ampliar)
Selecionar uma hora (clique para ampliar)

Como existem valores consistentemente mais altos à esquerda do gráfico, clique em um momento no eixo do tempo para ver o mapa de calor da latência naquele momento.

Mapa de calor de latência (clique para ampliar)
Mapa de calor de latência (clique para ampliar)

O mapa de calor mostra que a latência foi de 261ms (quadrados roxos brilhantes) entre as zonas asia-east1-b e europe-west2-c. Para investigar mais, clique no quadrado roxo brilhante. O gráfico de detalhes de latência que é aberto mantém sua seleção de tempo na página anterior, mostrando o alfinete azul.

Pico de latência (clique para ampliar)
Pico de latência (clique para ampliar)

A linha azul mostra um aumento na latência para o tráfego que viaja de europe-west2-c a asia-east1-b.

Para aumentar o zoom, clique e arraste o mouse.

Clicar e arrastar para ampliar (clique para ampliar)
Clicar e arrastar para aumentar o zoom (clique para ampliar)

Agora você vê que o pico durou de 2 a 3 minutos, atingindo um pico às 8h19.

Detalhes do pico de latência (clique para ampliar)
Detalhes do pico de latência (clique para ampliar)

Visualização de dados ao visualizar dados históricos

Ao visualizar dados por um período de um dia ou mais, o gráfico fornece dados adicionais em uma cor mais clara (uma moldura) ao redor dos dados primários. Devido ao período mais longo, os dados são agregados em intervalos mais longos. Por exemplo, uma hora de dados é agregada em intervalos de um minuto e 24 horas de dados são agregadas em intervalos de cinco minutos. A cor mais clara ao redor da linha mostra o intervalo de valores, do mais baixo ao mais alto, que foram agregados para desenhar a linha principal.

Dados históricos agregados (clique para ampliar)
Dados históricos agregados (clique para ampliar)

A seguir