Le tableau de bord "Présentation de GKE Enterprise" de la console Google Cloud fournit une vue d'ensemble de votre parc. La présentation vous aide à utiliser les fonctionnalités de GKE Enterprise en vous indiquant le nombre de problèmes de sécurité rencontrés par votre parc, la couverture de Policy Controller à l'échelle de votre parc et l'état de synchronisation de vos packages Config Sync. En outre, le tableau de bord fournit une vue au niveau du parc de l'utilisation des ressources de vos parcs, clusters et équipes. Vous pouvez utiliser ces informations pour optimiser les dépenses, la conception des applications et l'allocation des ressources, y compris l'utilisation du processeur, de la mémoire et du disque.
Dans cette page, nous partons du principe que vous maîtrisez la gestion des ressources dans Kubernetes. Pour en savoir plus, consultez la section Gestion des ressources pour les pods et les conteneurs dans la documentation de Kubernetes.
La présentation de GKE Enterprise dans la console Google Cloud n'est disponible que pour les utilisateurs du parc qui ont activé GKE Enterprise.
Consulter la présentation
Pour afficher le tableau de bord "Vue d'ensemble" :
Après avoir sélectionné le projet hôte de votre parc, accédez à la page de présentation de GKE Enterprise dans la console Google Cloud.
Sélectionner un filtre temporel
Par défaut, la présentation de GKE Enterprise indique l'utilisation des ressources au cours de la dernière heure. Pour modifier cette période, utilisez l'option de filtre temporel :
- Sélectionnez la période sur laquelle vous souhaitez afficher l'utilisation moyenne des ressources des conteneurs du parc. Choisissez l'une des options prédéfinies ou sélectionnez Personnalisée pour spécifier une période personnalisée.
Afficher les clusters, les niveaux d'accès d'équipe et l'utilisation totale des ressources
La première section fournit une vue d'ensemble de vos clusters, des niveaux d'accès de l'équipe et de l'utilisation totale du processeur/de la mémoire/du disque au cours de la période que vous avez sélectionnée. Les métriques d'utilisation des ressources sont générées à l'aide des données système Cloud Monitoring des clusters de votre parc.
Si la notification Données manquantes de... s'affiche, consultez la section Activer le système Cloud Monitoring pour les clusters de parc pour résoudre le problème.
Afficher l'état du cluster
Dans la section Clusters de ce parc, vous pouvez voir le nombre de clusters présents dans votre parc. En cas de problème de connectivité du cluster au parc, des avertissements ou des erreurs s'affichent. C'est le cas, par exemple, si vous avez supprimé un cluster sans annuler son enregistrement au préalable, ou si vous devez vous connecter à un cluster situé en dehors de Google Cloud pour en afficher les détails.
- Si une erreur ou un avertissement s'affiche, cliquez sur la notification pour afficher le ou les clusters problématiques, et résoudre le problème.
- Cliquez sur Afficher tous les clusters pour afficher la liste complète des clusters de votre parc.
Afficher les niveaux d'accès d'une équipe
Dans la section Niveaux d'accès d'équipe, vous pouvez voir le nombre de niveaux d'accès d'équipe dans ce parc. Les niveaux d'accès d'équipe vous permettent de définir des sous-ensembles de ressources de parc par équipe. Une fois ces niveaux d'accès définis, vous pouvez utiliser les fonctionnalités de gestion des équipes afin que chaque équipe puisse agir en tant que "locataire" distinct sur votre parc.
- Cliquez sur Afficher tous les niveaux d'accès d'équipe pour afficher la liste complète des niveaux d'accès d'équipe dans votre parc.
Afficher l'utilisation totale des ressources
La section Utilisation totale indique l'utilisation moyenne de toutes les ressources réelles de processeur, de mémoire et de disque de vos conteneurs de parc, par rapport aux ressources pouvant être allouées aux nœuds de ce parc. Les données s'affichent en fonction de la période que vous avez choisie. L'indication Pouvant être alloué sur un nœud Kubernetes correspond à la quantité de ressources pouvant être utilisées par les pods standards de ce nœud.
Cette vue offre un aperçu rapide de l'utilisation des ressources et des ressources disponibles de votre parc. Elle peut indiquer les problèmes potentiels à examiner plus en détail avec des métriques plus détaillées. Par exemple, si l'utilisation totale du processeur est très faible, vous pouvez utiliser les métriques "par cluster" ci-dessous pour identifier les clusters pouvant être redimensionnés.
Afficher la gestion des caractéristiques
Afficher les problèmes de sécurité
Pour vous aider à identifier les problèmes de sécurité qui affectent les clusters membres de votre parc, tels que les failles actives ou les problèmes de configuration des charges de travail, consultez la section Problèmes de sécurité. Cette section affiche les informations suivantes:
- Nombre total de problèmes détectés dans votre parc. Les problèmes sont regroupés par gravité, et le niveau de gravité est attribué en fonction de l'échelle de gravité qualitative CVSS.
- Répartition des problèmes par type. Cela vous permet de déterminer si les problèmes proviennent de problèmes de configuration, d'un bulletin de sécurité ou d'une faille.
Pour afficher une présentation de votre sécurité GKE et des conseils exploitables sur la résolution des problèmes détectés, cliquez sur Afficher la stratégie de sécurité. Si vous n'avez jamais utilisé le tableau de bord de stratégie de sécurité auparavant, cliquez sur Activer la stratégie de sécurité pour activer l'API Container Security et accéder au tableau de bord de stratégie de sécurité.
Pour en savoir plus, consultez la section À propos du tableau de bord de stratégie de sécurité.
Afficher la couverture de Policy Controller
Policy Controller permet d'appliquer des règles entièrement programmables pour vos clusters. Ces règles servent de "garde-fous" et empêchent toute modification de la configuration de l'API Kubernetes de contrevenir aux contrôles de sécurité, opérationnels ou de conformité de votre organisation.
La section État de la règle indique le nombre de clusters pour lesquels Policy Controller est activé.
Cliquez sur Afficher la stratégie pour afficher le tableau de bord Policy Controller. Si vous n'avez pas installé Policy Controller sur un cluster, cliquez sur Activer Policy.
Pour en savoir plus sur Policy Controller, consultez sa documentation.
Afficher l'état du package Config Sync
Config Sync est un service GitOps qui permet aux opérateurs de cluster et aux administrateurs de plate-forme de déployer des packages à partir d'une source fiable. Un package contient toutes les configurations contenues dans chaque source à partir de laquelle vous synchronisez votre cluster. La source peut être un dépôt Git, un répertoire dans un dépôt Git, une image OCI ou un dépôt Helm. Étant donné que vous pouvez synchroniser votre cluster à partir de plusieurs sources, vous pouvez disposer de plusieurs packages par cluster.
La section État de la configuration affiche les informations suivantes:
- Nombre total de packages dans votre parc
- État de synchronisation des packages dans votre parc
Cliquez sur Afficher la présentation de la configuration pour afficher le tableau de bord Config Sync. Si vous n'avez pas installé Config Sync sur un cluster, cliquez sur Activer Config Sync.
Pour en savoir plus sur Config Sync, consultez sa documentation.
Afficher l'efficacité du parc
Cette section fournit une vue détaillée de l'utilisation que fait votre parc de ses ressources cloud ou sur site, y compris l'utilisation des ressources par parc, et l'utilisation principale et faible des ressources par cluster. Cela vous permet de voir, par exemple, les clusters potentiellement sous-utilisés ou surexploités que vous souhaitez redimensionner. Pour en savoir plus sur le calcul de ces métriques, consultez la page Métriques d'utilisation des ressources de parc.
Afficher l'utilisation des ressources au fil du temps
La ligne Utilisation du processeur/de la mémoire/du disque par parc vous permet d'examiner plus en détail la manière dont votre parc utilise les ressources au fil du temps. Elle vous permet également de voir les ressources demandées par vos clusters, les ressources pouvant être allouées et l'utilisation réelle. Chaque panneau affiche un graphique de votre utilisation agrégée des processeurs, de la mémoire ou du disque au cours de la période choisie, avec les informations suivantes affichées sous forme de lignes distinctes:
- Pouvant être alloué : quantité de la ressource pouvant être allouée à vos nœuds de cluster de parc
- Demandé : quantité de ressources demandée par les conteneurs de votre parc
- Utilisé : quantité réelle de la ressource utilisée par vos conteneurs
Pour afficher les détails d'un point donné du graphique, faites défiler le graphique jusqu'à l'heure qui vous intéresse (par exemple, un pic visible de l'utilisation réelle sur le graphique). Les informations sur l'utilisation des ressources pouvant être allouées, demandées et des ressources réelles pour cette période sont affichées.
Pour activer ou désactiver l'affichage d'une ou de plusieurs lignes du graphique, cliquez sur la ou les métriques appropriées sous le graphique.
Afficher l'utilisation principale des ressources par cluster
La ligne suivante indique l'utilisation principale du processeur/de la mémoire/du disque par cluster de votre parc, ce qui vous permet d'identifier rapidement les clusters spécifiques qui utilisent le plus les ressources pouvant être allouées. Chaque panneau répertorie vos cinq clusters principaux par ordre d'utilisation (le plus élevé en premier). Pour chaque cluster, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie. Cette vue peut, par exemple, vous aider à identifier les clusters surexploités. Les clusters qui ne disposent pas de suffisamment de ressources disponibles risquent de ne pas pouvoir planifier des pods.
Cliquez sur le nom du cluster qui vous intéresse pour afficher plus de détails sur la manière dont le cluster utilise ses ressources. Dans la vue d'utilisation, vous pouvez également voir le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.
Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher la liste triée de tous les clusters de votre parc.
Afficher la faible utilisation des ressources par cluster
La dernière ligne d'utilisation des ressources indique la faible utilisation du processeur/de la mémoire/du disque par cluster de votre parc, afin que vous puissiez identifier rapidement les clusters sous-utilisés. Les cinq clusters utilisant le moins de ressources apparaissent en haut de chaque panneau, avec un graphique de leur utilisation et une moyenne de l'utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie.
Cliquez sur le nom du cluster qui vous intéresse pour afficher plus de détails sur la manière dont le cluster utilise ses ressources. Dans la vue d'utilisation, vous pouvez également voir le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.
Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher la liste triée de tous les clusters de votre parc.
Afficher l'efficacité de l'équipe
Cette section offre un aperçu de la manière dont vos équipes utilisent leurs ressources cloud ou sur site. Cela vous permet également de surveiller les équipes qui rencontrent des problèmes.
Cliquez sur l'équipe qui vous intéresse pour afficher plus de détails dans le tableau de bord de l'équipe. Le tableau de bord de l'équipe vous permet d'afficher plus de détails sur l'utilisation des ressources et les espaces de noms de l'équipe. Cela peut vous aider à identifier les espaces de noms qui affectent l'utilisation des ressources de l'équipe.
Afficher l'utilisation principale des ressources par niveau d'accès d'équipe
L'utilisation du processeur/de la mémoire/du disque par champ d'application vous permet d'identifier rapidement les équipes spécifiques qui utilisent le plus leurs ressources. Chaque panneau répertorie vos principales équipes par ordre d'utilisation (la plus élevée en premier). Pour chaque équipe, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport à la requête.
Pour afficher l'utilisation des ressources de toutes vos équipes pour la période choisie, cliquez sur Afficher toutes les équipes par utilisation du processeur/de la mémoire/du disque.
Afficher la répartition des erreurs par champ d'application
Cette fiche indique les équipes ayant généré le plus de journaux d'erreurs pour la période choisie.
Pour afficher la liste des équipes triées par nombre d'erreurs, cliquez sur Afficher tous les champs d'application par nombre d'erreurs.
Afficher le nombre de redémarrages par champ d'application
Cette section présente les équipes ayant enregistré le plus grand nombre de redémarrages de conteneurs pour la période sélectionnée.
Pour afficher la liste des équipes triées par redémarrage, cliquez sur Afficher tous les champs d'application par redémarrage.
Activer le système Cloud Monitoring pour les clusters de parcs
Comme indiqué dans la section Afficher les clusters, les niveaux d'accès de l'équipe et l'utilisation totale des ressources, les métriques du tableau de bord sont générées à l'aide de données Cloud Monitoring pour les composants de cluster (tels que les charges de travail dans les espaces de noms kube-system
et gke-connect
). Par conséquent, Cloud Monitoring doit être activé pour tous les composants système, de plan de contrôle et Kube State Metrics de vos clusters membres de parc.
Cloud Logging et Cloud Monitoring sont activés par défaut sur la plupart des clusters GKE et GKE Enterprise, mais vous devez toujours activer manuellement Cloud Monitoring pour tous les composants du cluster. Les clusters associés nécessitent toujours que vous configuriez Cloud Monitoring manuellement.
Si Cloud Monitoring n'est pas activé pour l'un des composants de cluster de votre parc, un panneau s'affiche en haut de la page indiquant le nombre de clusters avec des données manquantes.
Pour activer Cloud Monitoring pour les composants de ces clusters, consultez les guides suivants correspondant à votre type de cluster:
- Configurer la journalisation et la surveillance pour GKE
- Utiliser Cloud Logging et Cloud Monitoring avec Google Distributed Cloud
- Configurer Cloud Logging et Cloud Monitoring pour Google Distributed Cloud
- Journalisation et surveillance des clusters associés à GKE Enterprise
- Autoriser la journalisation et la surveillance de GKE sur AWS
- Autoriser la journalisation et la surveillance pour GKE sur Azure.
- Journalisation et surveillance de GKE sur AWS (génération précédente)
Activer la surveillance des clusters enregistrés multiprojets
Pour collecter et afficher des métriques de plusieurs projets Google Cloud, Cloud Monitoring vous permet de créer des champs d'application de métriques multiprojets. Lorsque vous enregistrez un cluster GKE depuis un projet différent vers votre projet hôte de parc, un nouveau champ d'application de métriques incluant les deux projets est automatiquement créé (s'il n'existe pas déjà). Cela vous permet de voir les données d'utilisation du cluster dans la présentation.
Étapes suivantes
- Pour en savoir plus sur les métriques d'utilisation des ressources dans le tableau de bord et sur leur utilisation, consultez la page Métriques d'utilisation des ressources de parc.
- Découvrez comment observer vos clusters et leurs charges de travail à l'aide de Cloud Logging et de Cloud Monitoring.