Cas d'utilisation: Résoudre les problèmes de connectivité GKE

Dans ce cas d'utilisation, vous êtes un administrateur réseau chargé de gérer un réseau comprenant plusieurs espaces de noms GKE. Vous avez été alerté d'un problème de latence. Selon les informations dont vous disposez, l'application mobile de votre organisation est ralentie par intermittence et dépasse le délai d'attente. Vous savez qu'un certain nombre d'utilisateurs différents sont affectés et qu'il n'y a eu aucun déploiement d'application récent. Le problème est probablement lié à un cluster GKE spécifique.

Le cas d'utilisation suivant montre comment Network Topology peut vous aider à identifier et à résoudre rapidement les problèmes de votre déploiement GKE.

Détails de la topologie

Le déploiement s'étend sur trois régions Google Cloud (us-central1, europe-west1 et asia-east1). Toutes les requêtes client externes sont traitées par les trois clusters des trois régions avec plusieurs espaces de noms. Les requêtes des clients provenant de l'une des trois régions commerciales (Amériques, EMEA et APAC) sont traitées par des instances d'application dans la région Google Cloud la plus proche.

La topologie suivante montre la hiérarchie de premier niveau du déploiement:

Latence du réseau

Dans ce scénario, nous supposons que vous disposez d'un cluster GKE nommé "boutique en ligne". Vous vérifiez la latence entre les clients externes et le cluster GKE pour voir si la latence entre eux a changé. Vous constatez que c'est bien ce qui s'est produit et décidez d'examiner plus en détail les nœuds du cluster.

  1. Vous filtrez la topologie pour n'afficher que le trafic de votre cluster online-boutique.

    Dans la section Filtre, vous pouvez ajouter un filtre pour sélectionner des nœuds et leurs pairs. Cette section n'est disponible que pour les vues de métriques et non pour les vues d'insights. Cliquez sur Ajouter un filtre, puis sélectionnez le type de nœud et le nœud.

    Après avoir appliqué le filtre, Network Topology n'affiche que les connexions liées au cluster, comme illustré dans l'exemple suivant.

  2. En commençant par les clients externes dans la région Amériques, vous cliquez sur les métriques de trafic entre la région commerciale Amériques et le cluster GKE. Network Topology affiche des graphiques dans le volet de détails. Les informations incluent le trafic entrant et sortant entre l'entité que vous avez sélectionnée et l'entité associée. Par exemple, Network Topology fournit les dernières valeurs de requêtes par seconde (RPS) et de latence de la requête HTTP. Dans le graphique de latence de la requête, vous voyez les valeurs des 50e, 95e et 99e centiles. Dans cet exemple, imaginons que toutes les valeurs de latence sont plus élevées que prévu.

  3. Pour développer les graphiques de séries temporelles sur six semaines, en haut du volet "Détails", sélectionnez 6 semaines.

    Vous voyez un bond important qui s'est produit il y a environ deux heures, à peu près lorsque les premiers problèmes ont été signalés. Vous êtes convaincu que le problème est lié à une latence accrue avec un pod GKE.

  4. Pour obtenir une vue d'ensemble du problème, vous examinez plus en détail les nœuds GKE. Pour en savoir plus sur le dépannage des nœuds GKE, consultez la page Résoudre les problèmes de connectivité GKE.

Étape suivante