Caso d'uso: risolvere i problemi di connettività di GKE

In questo caso d'uso, sei un amministratore di rete che supporta una rete che include diversi spazi dei nomi GKE. Sei stato avvisato di un problema di latenza e ti è stato comunicato che l'applicazione mobile della tua organizzazione è a intermittenza e in timeout. Sai che la modifica ha interessato diversi utenti e che di recente non sono stati eseguiti deployment delle applicazioni. Il problema è probabilmente correlato a un cluster GKE specifico.

Il seguente caso d'uso dimostra in che modo Network Topology può aiutarti a risolvere rapidamente i problemi e analizzare i problemi del deployment di GKE.

Dettagli topologia

Il deployment interessa tre regioni Google Cloud (us-central1, europe-west1 e asia-east1). Tutte le richieste client esterne vengono gestite dai tre cluster all'interno delle tre regioni con più spazi dei nomi. Le richieste dei client che provengono da una delle tre regioni aziendali (Americhe, EMEA e APAC) vengono gestite da istanze dell'applicazione nella regione Google Cloud più vicina.

La seguente topologia mostra la gerarchia di primo livello per il deployment:

Latenza di rete

In questo scenario, supponiamo di avere un cluster GKE denominato online-boutique. Puoi controllare la latenza tra i client esterni e il cluster GKE per vedere se la latenza tra i client è cambiata. Scopri che è cambiato e decidi di analizzare ulteriormente i nodi del cluster.

  1. Filtra la topologia per mostrare solo il traffico per il tuo cluster online-boutique.

    Nella sezione Filtro, puoi aggiungere un filtro per selezionare nodi e relativi peer. Questa sezione è disponibile solo per le visualizzazioni delle metriche e non per le viste degli approfondimenti. Fai clic su Aggiungi filtro e seleziona il tipo e il nodo.

    Dopo aver applicato il filtro, Network Topology mostra solo le connessioni relative al cluster, come mostrato nell'esempio seguente.

  2. Partendo dai client esterni nelle Americhe, fai clic sulle metriche del traffico tra la regione aziendale Americhe e il cluster GKE. Network Topology mostra i grafici nel riquadro dei dettagli. Le informazioni includono il traffico in entrata e in uscita tra l'entità selezionata e l'entità connessa. Ad esempio, Network Topology fornisce i valori più recenti per le query al secondo (QPS) e la latenza delle richieste HTTP. Nel grafico della latenza delle richieste sono visualizzati i valori per il 50°, 95° e 99° percentile. In questo esempio, supponiamo che tutti i valori di latenza siano superiori al previsto.

  3. Per espandere i grafici delle serie temporali a 6 settimane, seleziona 6 settimane nella parte superiore del riquadro dei dettagli.

    Noti un aumento significativo avvenuto circa due ore fa, all'incirca quando sono stati segnalati i primi problemi. Hai la certezza che il problema sia legato all'aumento della latenza con un pod GKE.

  4. Avendo una visione generale del problema, analizzerai ulteriormente i nodi GKE. Per saperne di più sulla risoluzione dei problemi dei nodi GKE, consulta Risolvere i problemi di connettività di GKE.

Passaggi successivi