Exemplo de utilização: resolva problemas de conetividade do GKE

Neste exemplo de utilização, é um administrador de rede que suporta uma rede que inclui vários espaços de nomes do GKE. Recebeu um alerta sobre um problema de latência e foi informado de que a aplicação para dispositivos móveis da sua organização está intermitentemente lenta e a atingir o limite de tempo. Sabe que vários utilizadores diferentes são afetados e que não houve implementações recentes da aplicação. O problema está provavelmente relacionado com um cluster do GKE específico.

O exemplo de utilização seguinte demonstra como a topologia de rede pode ajudar a resolver problemas e investigar rapidamente problemas na sua implementação do GKE.

Detalhes da topologia

A implementação abrange três Google Cloud regiões (us-central1, europe-west1 e asia-east1). Todos os pedidos de clientes externos são processados pelos três clusters nas três regiões com vários espaços de nomes. Os pedidos de clientes que provêm de uma de três regiões empresariais (Américas, EMEA e APAC) são publicados por instâncias da aplicação na regiãoGoogle Cloud mais próxima.

A topologia seguinte mostra a hierarquia de nível superior para a implementação:

Latência de rede

Neste cenário, suponha que tem um cluster do GKE denominado online-boutique. Verifica a latência entre os clientes externos e o cluster do GKE para ver se a latência entre eles mudou. Descobre que foi alterado e decide investigar mais aprofundadamente os nós do cluster.

  1. Filtra a topologia para mostrar apenas o tráfego do seu cluster online-boutique.

    Na secção Filtro, pode adicionar um filtro para selecionar nós e os respetivos pares. Esta secção só está disponível para visualizações de métricas e não para visualizações de estatísticas. Clique em Adicionar filtro e selecione o tipo de nó e o nó.

    Depois de aplicar o filtro, a topologia de rede mostra apenas as associações relacionadas com o cluster, conforme mostrado no exemplo seguinte.

  2. Começando pelos clientes externos nas Américas, clique nas métricas de tráfego entre a região empresarial das Américas e o cluster do GKE. A topologia de rede mostra gráficos no painel de detalhes. As informações incluem o tráfego de entrada e saída entre a entidade selecionada e a entidade associada. Por exemplo, a topologia de rede fornece os valores mais recentes para as consultas por segundo (CPS) e a latência do pedido HTTP. No gráfico de latência dos pedidos, vê valores para os percentis 50, 95 e 99. Neste exemplo, suponhamos que todos os valores de latência são superiores ao esperado.

  3. Para expandir os gráficos de intervalos temporais para 6 semanas, na parte superior do painel de detalhes, selecione 6 semanas.

    Vê um aumento significativo que ocorreu há cerca de duas horas, aproximadamente quando foram comunicados os primeiros problemas. Tem a certeza de que o problema está relacionado com o aumento da latência com um pod do GKE.

  4. Com uma vista geral do problema, investiga os nós do GKE mais detalhadamente. Para mais informações sobre a resolução de problemas de nós do GKE, consulte o artigo Resolva problemas de conetividade do GKE.

O que se segue?