Utiliser la présentation de GKE Enterprise

Le tableau de bord "Présentation de GKE Enterprise" de la console Google Cloud fournit une vue d'ensemble de votre parc. La présentation vous aide à utiliser les fonctionnalités de GKE Enterprise en vous indiquant le nombre de problèmes de sécurité rencontrés par votre parc, la couverture de Policy Controller à l'échelle de votre parc et l'état de synchronisation de vos packages Config Sync. En outre, le tableau de bord fournit une vue au niveau du parc de l'utilisation des ressources de vos parcs, clusters et équipes. Vous pouvez utiliser ces informations pour optimiser les dépenses, la conception des applications et l'allocation des ressources, y compris l'utilisation du processeur, de la mémoire et du disque.

Dans cette page, nous partons du principe que vous maîtrisez la gestion des ressources dans Kubernetes. Pour en savoir plus, consultez la section Gestion des ressources pour les pods et les conteneurs dans la documentation de Kubernetes.

La présentation de GKE Enterprise dans la console Google Cloud n'est disponible que pour les utilisateurs du parc qui ont activé GKE Enterprise.

Consulter la présentation

Pour afficher le tableau de bord d'aperçu, procédez comme suit:

Sélectionner un filtre de période

Par défaut, la présentation de GKE Enterprise indique l'utilisation des ressources au cours de la dernière heure. Pour modifier cette période, utilisez l'option de filtre de période:

  • Sélectionnez la période sur laquelle vous souhaitez afficher l'utilisation moyenne des ressources des conteneurs de parc. Choisissez l'une des options prédéfinies ou sélectionnez Personnalisée pour spécifier une période personnalisée.

Afficher les clusters, les niveaux d'accès des équipes et l'utilisation totale des ressources

La première section fournit une vue d'ensemble de vos clusters, des niveaux d'accès de l'équipe et de l'utilisation totale du processeur/de la mémoire/du disque au cours de la période que vous avez choisie. Les métriques d'utilisation des ressources sont générées à l'aide des données système Cloud Monitoring des clusters de votre parc.

Si la notification Données manquantes de... s'affiche, consultez la section Activer Cloud Monitoring du système pour les clusters de parc pour résoudre le problème.

Afficher l'état du cluster

La section Clusters de ce parc vous permet de voir le nombre de clusters présents dans votre parc. En cas de problème de connectivité du cluster au parc, des avertissements ou des erreurs s'affichent. Par exemple, si vous avez supprimé un cluster sans annuler son enregistrement au préalable, ou si vous devez vous connecter vers un cluster situé en dehors de Google Cloud pour afficher ses détails.

  • Si une erreur ou un avertissement s'affiche, cliquez sur la notification pour afficher le ou les clusters problématiques, et le résoudre.
  • Cliquez sur Afficher tous les clusters pour afficher la liste complète des clusters de votre parc.

Afficher les niveaux d'accès d'équipe

Dans la section Champs d'application de l'équipe, vous pouvez voir le nombre de niveaux d'accès d'équipe dans ce parc. Les niveaux d'accès d'équipe vous permettent de définir des sous-ensembles de ressources de parc par équipe. Une fois que vous avez défini ces champs d'application, vous pouvez utiliser les fonctionnalités de gestion des équipes afin que chaque équipe puisse agir en tant que "locataire" distinct sur votre parc.

  • Cliquez sur Afficher tous les champs d'application d'équipe pour afficher la liste complète des niveaux d'accès d'équipe dans votre parc.

Afficher l'utilisation totale des ressources

La section Utilisation totale indique l'utilisation moyenne des ressources réelles de processeur, de mémoire et de disque de tous vos conteneurs de parc par rapport aux ressources pouvant être allouées aux nœuds de cluster de ce parc. Les données s'affichent au cours de la période sélectionnée. L'indication Pouvant être alloué sur un nœud Kubernetes correspond à la quantité de ressources pouvant être utilisées par les pods standards de ce nœud.

Cette vue offre un aperçu rapide de l'utilisation des ressources et des ressources disponibles de votre parc, et peut indiquer des problèmes potentiels à examiner plus en détail avec des métriques plus détaillées. Par exemple, si l'utilisation totale du processeur est très faible, vous pouvez utiliser les métriques "par cluster" pour identifier les clusters que vous pourriez redimensionner.

Afficher la gestion des caractéristiques

Afficher les problèmes de sécurité

Pour vous aider à identifier les problèmes de sécurité qui affectent les clusters membres de votre parc, tels que les failles actives ou les problèmes de configuration des charges de travail, consultez la section Problèmes de sécurité. Cette section vous fournit les informations suivantes:

  • Nombre total de problèmes détectés dans votre parc. Les problèmes sont regroupés par gravité, et la gravité est attribuée en fonction de l'échelle de gravité qualitative CVSS.
  • Répartition des problèmes par type. Cela vous permet de déterminer si les problèmes proviennent de problèmes de configuration, d'un bulletin de sécurité ou d'une faille.

Pour afficher une vue d'ensemble de la sécurité de GKE et des conseils exploitables sur la façon de résoudre les problèmes détectés, cliquez sur Afficher la stratégie de sécurité. Si vous n'avez jamais utilisé le tableau de bord de stratégie de sécurité, cliquez sur Activer la stratégie de sécurité pour activer l'API Container Security et accéder au tableau de bord de stratégie de sécurité.

Pour en savoir plus, consultez la section À propos du tableau de bord de stratégie de sécurité.

Afficher la couverture de Policy Controller

Policy Controller permet d'appliquer des règles entièrement programmables pour vos clusters. Ces règles servent de "garde-fous" et empêchent toute modification de la configuration de l'API Kubernetes de contrevenir aux contrôles de sécurité, opérationnels ou de conformité de votre organisation.

La section État de la règle indique le nombre de clusters sur lesquels Policy Controller est activé.

Cliquez sur Afficher la règle pour afficher le tableau de bord Policy Controller. Si vous n'avez pas installé Policy Controller sur un cluster, cliquez sur Activer Policy.

Pour en savoir plus sur Policy Controller, consultez sa documentation.

Afficher l'état du package Config Sync

Config Sync est un service GitOps qui permet aux opérateurs de cluster et aux administrateurs de plate-forme de déployer des packages à partir d'une source fiable. Un package contient toutes les configurations contenues dans chaque source à partir de laquelle vous synchronisez votre cluster. La source peut être un dépôt Git, un répertoire dans un dépôt Git, une image OCI ou un dépôt Helm. Étant donné que vous pouvez synchroniser votre cluster à partir de plusieurs sources, vous pouvez disposer de plusieurs packages par cluster.

La section État de la configuration affiche les informations suivantes:

  • Nombre total de colis dans votre parc
  • État de synchronisation des packages de votre parc

Cliquez sur Afficher la présentation de la configuration pour afficher le tableau de bord Config Sync. Si vous n'avez pas installé Config Sync sur un cluster, cliquez sur Activer Config Sync.

Pour en savoir plus sur Config Sync, consultez la documentation associée.

Afficher l'efficacité du parc

Cette section fournit une vue détaillée de l'utilisation de ses ressources cloud ou sur site par votre parc, y compris l'utilisation des ressources par parc, et l'utilisation principale et faible des ressources par cluster. Cela peut vous aider à identifier, par exemple, les clusters potentiellement sous-utilisés ou surexploités que vous souhaitez redimensionner. Pour en savoir plus sur le mode de calcul de ces métriques, consultez la section Métriques d'utilisation des ressources de parc.

Afficher l'utilisation des ressources au fil du temps

La ligne Utilisation du processeur/de la mémoire/du disque par parc vous permet d'examiner plus en détail l'utilisation des ressources par votre parc au fil du temps. Elle vous permet également de consulter les ressources demandées par vos clusters, les ressources pouvant être allouées et leur utilisation réelle. Chaque panneau affiche un graphique de l'utilisation agrégée des processeurs, de la mémoire ou du disque au cours de la période sélectionnée, avec les informations suivantes affichées sous forme de lignes distinctes:

  • Pouvant être alloué : quantité de la ressource pouvant être allouée à vos nœuds de cluster de parc
  • Demandé : quantité de ressources demandée par les conteneurs de votre parc
  • Utilisé : quantité réelle de la ressource utilisée par vos conteneurs

Pour afficher les détails d'un point donné du graphique, faites défiler le graphique jusqu'à l'heure qui vous intéresse (par exemple, un pic visible d'utilisation réelle sur le graphique). Les informations sur l'utilisation des ressources pouvant être allouées, demandées et des ressources réelles pour cette période sont affichées.

Pour activer/désactiver l'affichage d'une ou plusieurs lignes du graphique, cliquez sur la ou les métriques correspondantes sous le graphique.

Afficher l'utilisation principale des ressources par cluster

La ligne suivante indique l'utilisation principale du processeur/de la mémoire/du disque par cluster pour votre parc, ce qui vous permet d'identifier rapidement les clusters spécifiques qui utilisent le plus les ressources pouvant être allouées. Chaque panneau répertorie vos cinq principaux clusters par ordre d'utilisation (le plus élevé en premier). Pour chaque cluster, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie. Cette vue peut vous aider, par exemple, à voir les clusters surexploités. Les clusters qui ne disposent pas de suffisamment de ressources risquent de ne pas pouvoir planifier des pods.

Cliquez sur le nom du cluster qui vous intéresse pour en savoir plus sur l'utilisation de ses ressources par le cluster. Dans la vue d'utilisation, vous pouvez également voir le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.

Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher une liste triée de tous les clusters de votre parc.

Afficher l'utilisation faible des ressources par cluster

La dernière ligne d'utilisation des ressources indique l'utilisation faible du processeur/de la mémoire/du disque par cluster de votre parc, afin que vous puissiez rapidement voir quels clusters sont sous-utilisés. Les cinq clusters utilisant le moins de ressources apparaissent en haut de chaque panneau, avec un graphique de leur utilisation et une moyenne de l'utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie.

Cliquez sur le nom du cluster qui vous intéresse pour en savoir plus sur l'utilisation de ses ressources par le cluster. Dans la vue d'utilisation, vous pouvez également voir le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.

Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher une liste triée de tous les clusters de votre parc.

Afficher l'efficacité de l'équipe

Cette section offre une vue d'ensemble de la manière dont vos équipes utilisent leurs ressources cloud ou sur site. Cela vous permet également de surveiller quelles équipes rencontrent des problèmes.

Cliquez sur l'équipe qui vous intéresse pour afficher plus de détails dans le tableau de bord de l'équipe. Dans le tableau de bord de l'équipe, vous pouvez afficher plus de détails sur l'utilisation des ressources et les espaces de noms de l'équipe. Cela peut vous aider à identifier les espaces de noms qui affectent l'utilisation des ressources de l'équipe.

Afficher l'utilisation principale des ressources par niveau d'accès d'équipe

L'utilisation du processeur/de la mémoire/du disque par champ d'application vous permet d'identifier rapidement les équipes spécifiques qui utilisent le plus leurs ressources. Chaque panneau répertorie vos meilleures équipes par ordre d'utilisation (le plus élevé en premier). Vous pouvez afficher pour chaque équipe un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport à la requête.

Pour afficher l'utilisation des ressources de toutes vos équipes pour la période choisie, cliquez sur Afficher toutes les équipes par utilisation du processeur/de la mémoire/du disque.

Afficher la répartition des erreurs par champ d'application

Cette fiche indique les équipes qui ont le plus de journaux d'erreurs pour la période que vous avez choisie.

Pour afficher la liste des équipes triées par nombre d'erreurs, cliquez sur Afficher tous les champs d'application par nombre d'erreurs.

Afficher le nombre de redémarrages par champ d'application

Cette section indique les équipes ayant enregistré le plus grand nombre de redémarrages de conteneurs pour la période sélectionnée.

Pour afficher la liste des équipes triées par redémarrage, cliquez sur Afficher tous les champs d'application par redémarrages.

Activer Cloud Monitoring du système pour les clusters de parcs

Comme indiqué dans la section Afficher les clusters, les niveaux d'accès de l'équipe et l'utilisation totale des ressources, les métriques du tableau de bord sont générées à l'aide de données Cloud Monitoring pour les composants de cluster (tels que les charges de travail dans les espaces de noms kube-system et gke-connect). Par conséquent, Cloud Monitoring doit être activé pour tous les composants du système, du plan de contrôle et des métriques d'état Kube de vos clusters membres de parc.

Cloud Logging et Cloud Monitoring sont activés par défaut sur la plupart des clusters GKE et GKE Enterprise, mais vous devez toujours activer manuellement Cloud Monitoring pour tous les composants du cluster. Les clusters associés nécessitent toujours la configuration manuelle de Cloud Monitoring.

Si l'un des composants de cluster de votre parc n'a pas activé Cloud Monitoring, un panneau s'affiche en haut de la page indiquant le nombre de clusters avec des données manquantes.

Pour activer Cloud Monitoring pour les composants de ces clusters, consultez les guides suivants pour votre type de cluster:

Activer la surveillance des clusters enregistrés multiprojets

Pour collecter et afficher les métriques de plusieurs projets Google Cloud, Cloud Monitoring vous permet de créer des champs d'application de métriques multiprojets. Lorsque vous enregistrez un cluster GKE depuis un projet différent vers votre projet hôte de parc, un nouveau champ d'application de métriques incluant les deux projets est automatiquement créé (s'il n'existe pas déjà). Cela vous permet de consulter les données d'utilisation du cluster dans la présentation.

Étapes suivantes