Caso de uso: resolver problemas de conectividade do GKE

Nesse caso de uso, você é um administrador de rede compatível com uma rede que inclui vários namespaces do GKE. Você foi alertado sobre um problema de latência e foi informado que o aplicativo móvel da sua organização é intermitentemente lento e atinge o tempo limite. Você sabe que vários usuários diferentes são afetados e que não houve implantações de aplicativos recentes. O problema provavelmente está relacionado a um cluster específico do GKE.

O caso de uso a seguir demonstra como a Topologia de Rede pode ajudá-lo a solucionar rapidamente e investigar problemas em sua implantação do GKE.

Detalhes da topologia

A implantação abrange três regiões do Google Cloud (us-central1, europe-west1 e asia-east1). Todas as solicitações de clientes externos são disponibilizadas pelos três clusters nas três regiões com vários namespaces. Solicitações de clientes provenientes de uma das três regiões de negócios (Américas, EMEA e APAC) são atendidas por instâncias de aplicativos na região mais próxima do Google Cloud.

A topologia a seguir mostra a hierarquia de nível superior para a implantação:

.

Latência de rede

Neste cenário, suponha que você tenha um cluster do GKE chamado online-boutique. Você verifica a latência entre clientes externos e o balanceador de carga para ver se a latência entre eles foi alterada. Você descobre que ela mudou e decide investigar ainda mais os nós do cluster.

  1. Filtre a topologia para mostrar apenas o tráfego do cluster online-boutique.

    Na seção Filtro, é possível adicionar um filtro para selecionar nós e seus pares. Esta seção está disponível apenas para visualizações de métricas, e não para visualizações de insights. Clique em Adicionar filtro e selecione o tipo de nó e o nó.

    Depois de aplicar o filtro, a Topologia de Rede mostra apenas as conexões relacionadas ao balanceador de carga, conforme mostrado no exemplo a seguir.

  2. Começando com os clientes externos nas Américas, você clica nas métricas de tráfego entre a região de negócios das Américas e o balanceador de carga do GKE. A Topologia de rede mostra gráficos no painel de detalhes. As informações incluem tráfego de entrada e saída entre a entidade selecionada e a entidade conectada. Por exemplo, a Topologia de rede fornece os valores mais recentes para consultas por segundo (QPS) e a latência da solicitação HTTP. No gráfico de latência da solicitação, você vê valores para os percentis 50o, 95o e 99o. Neste exemplo, suponha que todos os valores de latência sejam mais altos do que o esperado.

  3. Para expandir os gráficos de séries temporais para seis semanas, na parte superior do painel de detalhes, selecione Seis semanas.

    Você vê um salto significativo que ocorreu há duas horas, aproximadamente quando os primeiros problemas foram relatados. Você tem certeza de que o problema está relacionado ao aumento da latência com um pod do GKE.

  4. Com uma visão de alto nível do problema, você investiga os nós do GKE posteriormente. Para mais informações sobre como solucionar problemas de nós do GKE, consulte Como solucionar problemas de conectividade do GKE.

A seguir