Observer vos clusters GKE

Cette page explique comment accéder aux tableaux de bord de surveillance de la suite d'opérations Cloud pour GKE et des anciens services Logging et Monitoring. Elle montre également comment utiliser le tableau de bord de surveillance de la suite d'opérations Cloud pour GKE.

Accéder au tableau de bord de surveillance

  1. Depuis Cloud Console, accédez à la page Monitoring :

    Accéder à Monitoring

  2. Sélectionnez Tableaux de bord, puis l'un des tableaux de bord suivants :

    • Pour les clusters sur lesquels la suite d'opérations Cloud pour GKE est activée, sélectionnez le tableau de bord nommé GKE.

    • Pour les clusters sur lesquels une ancienne version de Logging et Monitoring est activée, sélectionnez le tableau de bord nommé Clusters GKE.

    Si vous ne voyez aucun cluster ou si vous ne voyez pas toutes les ressources de vos clusters, consultez la page Résoudre les problèmes liés à votre tableau de bord GKE.

Interface du tableau de bord de la suite d'opérations Cloud pour GKE

Le tableau de bord de la suite d'opérations Cloud pour GKE est divisé en trois parties :

Affichage de la vue tabulaire du tableau de bord de la suite d'opérations Cloud pour GKE.

  1. La barre de filtre vous permet de sélectionner les ressources GKE à filtrer dans le tableau de bord.

  2. La chronologie des alertes vous permet de sélectionner une période spécifique pour votre tableau de bord, afin d'afficher un résumé des alertes correspondantes.

  3. Les tables affichent votre parc GKE par type : cluster, espace de noms, nœud, charges de travail, services, pods et conteneurs. Chaque ligne affiche une seule ressource avec des métriques. Cliquez sur une ligne pour ouvrir un panneau contenant plus de détails sur la ressource.

Barre de filtre

La barre de filtre vous permet de filtrer les ressources GKE affichées sur le tableau de bord afin d'afficher les données qui vous intéressent. Elle présente également les informations provenant d'autres ressources de votre cluster en lien avec vos sélections de filtres.

Utiliser la barre de filtre

Pour filtrer les données de votre tableau de bord, procédez comme suit :

  1. Cliquez sur la barre de filtre pour afficher les options de filtrage.

    Affichez les options de filtrage.

  2. Sélectionnez une ressource Kubernetes à filtrer, puis sélectionnez son nom.

    Si plusieurs ressources portent ce nom, sélectionnez l'instance de ressource spécifique pour le filtrage.

  3. Cliquez sur Appliquer.

    Le tableau de bord est actualisé et affiche les informations mises à jour.

Lorsque vous utilisez la barre de filtre, tenez compte des points suivants :

  • Après avoir appliqué un filtre au tableau de bord, vous pouvez cliquer à nouveau sur la barre de filtre pour filtrer des ressources supplémentaires.

  • Certaines ressources peuvent afficher un trop grand nombre d'options dans le menu de filtrage. Dans ce cas, vous devez d'abord filtrer sur une ressource parente pour affiner les options. Par exemple, si vous avez trop de pods à afficher, vous pouvez d'abord filtrer par cluster ou par une autre ressource Kubernetes pour affiner la liste des pods.

  • Pour clarifier le champ d'application de chaque chaîne de filtre, l'interface de filtrage peut afficher des filtres supplémentaires par défaut, en fonction de la ressource choisie. Par exemple, si vous effectuez un filtrage sur un espace de noms spécifique, le filtre ajoute le cluster dans lequel se trouve l'espace de noms.

    Affichez les autres options de filtrage sélectionnées par le système.

Chronologie des alertes

La chronologie des alertes vous permet d'afficher les alertes dans vos clusters. La chronologie des alertes vous donne un aperçu des infractions ayant généré une alerte qui se sont produites au cours de la période sélectionnée. Si vous placez votre pointeur sur une zone en rouge de la chronologie, des cartes d'événement apparaissent :

Utilisation de la vue chronologique d'une alerte Kubernetes.

Chaque carte d'événement fournit des informations détaillées sur une alerte affichée dans la chronologie.

Le menu déroulant de période vous permet de définir la période de chronologie des alertes et des tables de votre tableau de bord.

Utiliser les cartes d'événement

Lorsque vous passez la souris sur la chronologie des alertes, le tableau de bord affiche des cartes d'événement pour chaque infraction ayant généré une alerte. Une alerte dont le statut est indique que l'incident est toujours ouvert, tandis qu'une alerte dont le statut est indique que l'incident est clos.

Si la période sélectionnée comporte plus de deux alertes, vous pouvez faire défiler les cartes d'événement à l'aide de la molette de la souris. Vous pouvez également cliquer sur Afficher toutes les alertes pour afficher toutes les fiches d'événement dans un panneau.

Pour afficher l'incident ayant généré une alerte dans "Alertes", cliquez sur Afficher l'incident.

Dans la section Ressource associée, la carte de l'événement indique à quelle ressource l'alerte est associée. Si le tableau de bord ne parvient pas à déterminer la ressource à laquelle l'alerte est associée, la carte d'événement fournit un lien Mettre à jour la règle d'alerte qui vous redirige vers la page Modifier la règle d'alerte. Vous pouvez ensuite mettre à jour la règle d'alerte avec des informations supplémentaires afin que le tableau de bord puisse trouver la ressource associée.

Tables du tableau de bord

Le tableau de bord affiche une table de métriques pour chaque ressource GKE. Les tables comportent les colonnes suivantes :

  • Nom : nom à afficher de la ressource.

  • Alertes : nombre d'alertes ouvertes et confirmées pour cette ressource et ses enfants qui ont eu lieu sur la période sélectionnée.

  • Objectifs de niveau de service (SLO): une instruction des performances souhaitées pour vos services, mesurée via l'indicateur de niveau de service (SLI) sélectionné.

  • Redémarrages de conteneur : nombre de redémarrages d'un conteneur au cours de la période sélectionnée.

  • Journaux d'erreurs : nombre de journaux d'erreurs associés à une entité en fonction de la période sélectionnée.

  • Utilisation du processeur : utilisation du processeur par les conteneurs pouvant être attribuée à une ressource au cours de la période sélectionnée.

  • Utilisation de la mémoire : l'utilisation de la mémoire par les conteneurs pouvant être attribuée à une ressource au cours de la période sélectionnée.

    • La métrique utilisée est kubernetes.io/container/memory/request_utilization. Il existe deux types de mémoire : récupérable et non non récupérable. La mémoire récupérable est la mémoire qui sera supprimée de la ressource si l'utilisation devient trop élevée. Si l'utilisation de la mémoire non récupérable dépasse les limites, le conteneur peut être arrêté. Pour en savoir plus sur les limites de ressources, consultez la section Demandes et limites.
  • Utilisation du disque : utilisation du disque par les pods pouvant être attribuée à une ressource au cours de la période sélectionnée. Contrairement aux deux colonnes précédentes, cette métrique est créée par les pods et ne s'affiche pas dans la table Conteneurs.

Concernant les colonnes d'utilisation, tenez compte des informations suivantes :

  • Ces colonnes n'affichent pas de ratio, mais deux points de données différents, séparés par une barre oblique /. Le premier nombre indique la capacité totale demandée pour cette ressource individuelle. Le second chiffre indique le pourcentage d'utilisation de la capacité demandée.

  • Les graphiques sparklines affichent les données d'utilisation au cours de la période sélectionnée sur la page.

Configurer les tables du tableau de bord

Vous pouvez configurer les tables du tableau de bord pour afficher les informations qui vous intéressent le plus. À l'aide du menu déroulant Configurer des tables de ressources à côté de la barre de filtre, vous pouvez sélectionner les colonnes à afficher. Vous pouvez également choisir d'afficher ou non les graphiques sparkline dans les tables.

Notez que ces configurations s'appliquent à toutes les tables du tableau de bord.

Affichage du menu déroulant "Configurer des tables de ressources".

Pour configurer vos tables, procédez comme suit :

  1. Sélectionnez le menu déroulant "Configurer des tables de ressources".

  2. Sélectionnez les colonnes à afficher dans les tables.

    Les colonnes Nom et Alertes actives sont obligatoires.

  3. Indiquez si vous souhaitez afficher les graphiques sparkline.

  4. Cliquez sur Appliquer pour apporter les modifications.

Afficher les détails de la ressource

Le tableau de bord de la suite d'opérations Cloud pour GKE affiche par défaut une ligne récapitulative pour chaque ressource Kubernetes. Cliquez sur une ligne d'une table pour afficher les détails de cette ressource.

Affichage des informations détaillées sur une ressource.

Le panneau des informations détaillées sur la ressource affiche des informations sur la ressource sélectionnée. Il fournit également un onglet Alerts (Alertes) qui affiche des informations sur les alertes ouvertes, un onglet Events (Événements) qui affiche les événements Kubernetes associés à la ressource sélectionnée, un onglet Metrics (Métriques) qui affiche les métriques dans les graphiques, et un onglet Logs (Journaux) qui affiche les journaux générés par la ressource.

Pour afficher l'incident ayant généré une alerte dans "Alertes", cliquez sur Afficher les alertes.

Afficher des événements Kubernetes

L'onglet Events (Événements) du panneau de détails de la ressource affiche les événements Kubernetes associés à la ressource. Les événements Kubernetes sont disponibles pour toutes les ressources, à l'exception des conteneurs.

Affichage d'un onglet "Événement" pour un détail de ressource.

L'onglet Events (Événements) comporte une série de fiches qui affichent des informations sur chaque événement. Une fiche fournit également un lien vers la ressource associée si l'événement s'est produit dans une ressource inférieure. Vous pouvez cliquer sur View log (Afficher le journal) pour ouvrir l'explorateur de journaux afin d'afficher le journal associé à l'événement. Vous pouvez également cliquer sur Copy message (Copier le message) pour copier le message de journal dans votre presse-papiers.

Pour afficher tous les événements de l'explorateur de journaux, cliquez sur View in Logging (Afficher dans Logging). L'explorateur de journaux s'ouvre et affiche tous les journaux associés aux événements Kubernetes.

Gérer les SLO

Vous pouvez suivre l'état et les performances de vos applications à l'aide d'objectifs de niveau de service (SLO). Après avoir configuré le tableau de bord pour afficher la colonne Objectifs de niveau de service (SLO), vous pouvez voir si vos applications atteignent leurs SLO. Le SLO de votre ressource peut présenter l'un des états suivants:

  • Healthy (Opérationnel) : indique que la ressource est conforme au SLO spécifié. Cet état est vert.

  • Out of error budget (Hors marge d'erreur) : indique que la ressource a épuisé sa marge d'erreur, ce qui signifie que d'autres événements incorrects peuvent entraîner votre violation de son SLO. Cet état est associé à un indicateur jaune.

  • Unhealthy (Non opérationnel) : indique que la ressource est hors du SLO et qu'elle comporte une alerte qui se déclenche. Cet état est associé à un indicateur rouge.

  • No status (Aucun état) : indique qu'aucune donnée n'existe pour ce SLO. Cet état est gris.

Pour en savoir plus sur ces concepts, consultez la page Concepts de la surveillance des services.

Détails du SLO

Vous ne pouvez définir des SLO que pour les ressources Kubernetes suivantes: espaces de noms, charges de travail et services Kubernetes. Pour afficher des informations détaillées sur la conformité du SLO dans votre ressource, cliquez sur la ressource pour ouvrir le panneau de détails. Dans le panneau de détails, cliquez sur l'onglet SLOS.

Affichage de l'onglet SLO dans le panneau de détails.

Créer un SLO

Vous pouvez créer un SLO pour votre ressource Kubernetes à partir du tableau de bord de surveillance Cloud Operations for GKE.

Sur leTableau de bord GKE cliquez sur dans la ligne de la ressource Kubernetes pour ouvrir le panneau Créer un objectif de niveau de service (SLO).

Dans le panneau de détails de la ressource, cliquez sur Créer un SLO pour ouvrir le panneau Créer un objectif de niveau de service (SLO).

Affichage du panneau de création des SLO.

Pour savoir comment remplir le formulaire et créer un SLO, reportez-vous au guide Créer un SLO.

Afficher les journaux dans l'explorateur de journaux

Vous pouvez rechercher et afficher les données de journal de votre cluster via l'explorateur de journaux. L'explorateur de journaux vous permet d'afficher vos journaux et d'analyser vos données de journaux ainsi que d'affiner vos paramètres de requête.

Vous trouverez plus de détails sur l'utilisation de l'explorateur de journaux dans la documentation de Logging.

Dépannage

Pour obtenir des informations de dépannage, consultez la page Résoudre les problèmes liés à votre tableau de bord GKE.