Observer vos clusters GKE

Cette page explique comment accéder aux tableaux de bord de surveillance de Kubernetes Engine Monitoring, à celui des anciens Logging et Monitoring, et comment utiliser le tableau de bord de surveillance de Kubernetes Engine Monitoring.

Accéder au tableau de bord de surveillance

  1. Depuis Cloud Console, accédez à la page Monitoring :

    Accéder à Monitoring

    Si votre projet Google Cloud est déjà associé à un espace de travail, la page d'accueil de Cloud Monitoring s'affiche. Sinon, un espace de travail est créé automatiquement. En règle générale, ce processus ne nécessite aucune interaction de votre part, mais peut prendre quelques instants. Dans certains cas, la boîte de dialogue Ajouter votre projet à un espace de travail s'affiche. Le plus simple consiste alors à créer un espace de travail.

  2. Sélectionnez Tableaux de bord :

    • Si vos clusters utilisent Kubernetes Engine Monitoring, sélectionnez le tableau de bord intitulé Kubernetes Engine Nouveau.

      Ce tableau de bord n'affiche que les clusters qui utilisent Kubernetes Engine Monitoring. Si aucun cluster n'est répertorié ou que certaines ressources de cluster sont absentes, consultez la section Dépannage de cette page.

    • Si vos clusters utilisent les anciens Logging and Monitoring, sélectionnez le tableau de bord intitulé Kubernetes Engine.

Interface du tableau de bord Kubernetes Engine Monitoring

Le tableau de bord de Kubernetes Engine Monitoring est divisé en trois parties :

Affichage du tableau de bord Kubernetes Engine Monitoring.

  1. La barre d'outils du tableau de bord permet de contrôler la période associée aux observations et fournit des paramètres et des filtres pour le tableau de bord.

  2. Le sélecteur d'événements de chronologie vous permet de sélectionner une heure spécifique et d'afficher les résumés des alertes. Pour en savoir plus, consultez la section Événements de chronologie.

  3. La section des détails vous permet de choisir la façon dont les informations de votre cluster vous sont présentées. La section suivante fournit davantage d'informations concernant vos choix.

Onglets d'affichage

Les onglets d'affichage du tableau de bord Kubernetes Engine Monitoring vous permettent d'organiser les informations de votre cluster selon différentes hiérarchies :

  • Infrastructure : regroupe les ressources par cluster, nœud, pod et conteneur.

  • Workloads (Charges de travail) : regroupe les ressources par cluster, espace de noms, charge de travail, pod et conteneur.

  • Services : regroupe les ressources par cluster, espace de noms, service, pod et conteneur.

Sélection du mode d'affichage de Kubernetes Engine Monitoring.

Le tableau est trié de façon à afficher en premier les ressources Kubernetes avec des incidents ouverts. Pour afficher les sous-composants d'une ressource, cliquez sur le bouton à côté de cette ressource. La capture d'écran suivante présente une hiérarchie développée des ressources Kubernetes :

Affichage de la hiérarchie développée des ressources Kubernetes.

Chaque nom de ressource est précédé d'un indicateur rouge ou vert. L'indicateur rouge signifie que la ressource, ou un sous-composant de la ressource, a un incident ouvert. L'indicateur vert signifie qu'aucun incident n'est ouvert : Pour afficher les détails des alertes, les métriques et les journaux d'une ressource, cliquez sur sa ligne. Pour en savoir plus, consultez la section Afficher les alertes, métriques, journaux et détails.

Définitions de colonne

Le tableau de bord Kubernetes Engine Monitoring affiche les données dans les colonnes en fonction de la période sélectionnée :

  • Name (Nom) : libellé que vous avez attribué à la ressource Kubernetes.
  • Resource type (Type de ressource) : les valeurs possibles sont Cluster (Cluster), Container (Conteneur), Namespace (Espace de noms), Node (Nœud), Pod (Pod) et Workspace (Espace de travail).
  • Ready (Prêt) : nombre d'instances de nœud disponibles.
  • Incidents : nombre d'infractions associées aux alertes.
  • CPU Utilization (Utilisation du processeur) : pourcentage d'utilisation par rapport aux ressources processeur demandées.
  • Memory Utilization (Utilisation de la mémoire) : pourcentage d'utilisation de la mémoire demandée.
  • Total Memory Usage (Utilisation totale de la mémoire) : quantité de mémoire allouée.

Afficher les alertes, métriques, journaux et détails

Le tableau de bord Kubernetes Monitoring affiche par défaut une ligne récapitulative pour chaque ressource Kubernetes. Chaque ressource disposant d'un sous-composant est répertoriée avec un bouton de développement , et toutes les ressources sont répertoriées avec un indicateur rouge ou vert. L'indicateur rouge signifie que la ressource, ou un sous-composant de la ressource, a un incident ouvert. L'indicateur vert signifie qu'aucun incident n'est ouvert :

  • Pour afficher les sous-composants d'une ressource, cliquez sur le bouton à côté de cette ressource.
  • Pour ouvrir un volet contenant un récapitulatif des incidents, des métriques système, des journaux et des détails concernant une ressource, cliquez sur la ligne de la ressource. Lorsque vous cliquez sur une ligne, les informations affichées dépendent du type de ressource. Par exemple, lorsque vous cliquez sur la ligne d'un cluster, les métriques et les informations de journal ne s'affichent pas. Toutefois, ces informations apparaissent lorsque vous cliquez sur la ligne d'un pod.

    Dans l'exemple suivant, aucun incident n'est ouvert sur le nœud :

    Affichage des détails des alertes Kubernetes.

    Pour accéder à la page Kubernetes dans Cloud Console, cliquez sur Manage (Gérer).

Événements de chronologie

Vous pouvez également accéder au panneau des détails des alertes à partir du sélecteur d'événements de chronologie du tableau de bord Kubernetes Engine Monitoring. Une chronologie des incidents vous donne un aperçu des infractions qui se sont produites au cours de la période sélectionnée. Si vous placez votre pointeur sur une zone en rouge de la chronologie, des cartes d'événement apparaissent :

Utilisation de la vue chronologique d'une alerte Kubernetes.

Chaque carte d'événement fournit des informations détaillées sur un incident affiché dans la chronologie. Pour consulter les détails des alertes d'un événement, cliquez sur sa carte d'événement.

Dépannage

Si vous ne disposez pas de l'option Kubernetes Engine NOUVEAU dans le menu Ressource, cela signifie que vous n'avez aucun cluster GKE utilisant Kubernetes Engine Monitoring. De même, si Kubernetes Engine n'est pas répertorié, cela signifie que vous n'avez pas de clusters GKE utilisant les anciens Logging and Monitoring.

Si vous ne voyez aucune ressource Kubernetes dans votre tableau de bord Kubernetes Engine Monitoring, vérifiez les points suivants :

  • Le bon projet Google Cloud est-il sélectionné en haut de la page ? Si ce n'est pas le cas, sélectionnez un projet dans la liste déroulante de la barre de menu. Vous devez choisir le projet pour lequel vous souhaitez afficher les données.

  • Des activités ont-elles été enregistrées pour votre projet ? Si vous venez de créer le cluster, attendez quelques minutes qu'il se remplisse de données. Pour en savoir plus, consultez la section Installer la compatibilité avec la surveillance et la journalisation.

  • La période définie est-elle trop restrictive ? Vous pouvez sélectionner d'autres périodes ou définir une période personnalisée dans le menu Time (Temps) de la barre d'outils du tableau de bord.

  • Disposez-vous des autorisations appropriées pour afficher le tableau de bord ? Si l'un des messages d'erreur suivants (indiquant un refus d'autorisation) s'affiche lorsque vous consultez les informations de déploiement d'un service ou les métriques d'un projet Google Cloud, vous devez mettre à jour votre rôle Cloud Identity and Access Management pour inclure roles/monitoring.viewer ou roles/viewer :

    • You do not have sufficient permissions to view this page
    • You don't have permissions to perform the action on the selected resources

    Pour plus de détails, consultez la section Rôles prédéfinis.

  • Le compte de service de votre cluster est-il autorisé à écrire des données dans Monitoring et Logging ? Si vous constatez des taux d'erreur élevés sur votre tableau de bord d'API, il se peut que votre compte de service ne dispose pas des rôles suivants :

    • roles/logging.logWriter : Dans Google Cloud Console, ce rôle est appelé Rédacteur de journaux. Pour en savoir plus sur les rôles Logging, consultez le guide de contrôle d'accès de Logging.

    • roles/monitoring.metricWriter : Dans Google Cloud Console, ce rôle est appelé Rédacteur de métriques Monitoring. Il autorise un compte de service à écrire des données de métriques dans un espace de travail. Pour en savoir plus sur les rôles Monitoring, consultez le guide de contrôle d'accès de Monitoring.

    • roles/stackdriver.resourceMetadata.writer : Dans Google Cloud Console, ce rôle est appelé Rédacteur de métadonnées de ressource Stackdriver. Il accorde un accès en écriture seule aux métadonnées de ressource et fournit précisément les autorisations nécessaires aux agents qui envoient des métadonnées. Pour en savoir plus sur les rôles Monitoring, consultez le guide de contrôle d'accès de Monitoring.