Cette page explique comment identifier les clusters Google Kubernetes Engine (GKE) sous-provisionnés et surprovisionnés. GKE fournit des insights et des recommandations pour les scénarios d'optimisation des coûts (clusters surprovisionnés et inactifs, par exemple) et d'amélioration de la fiabilité (clusters sous-provisionnés, par exemple). GKE fournit des recommandations correspondantes pour augmenter ou réduire la taille des clusters, ou les supprimer. Pour les clusters inactifs, consultez Identifier les clusters GKE inactifs.
Après avoir vérifié que les clusters identifiés bénéficieraient de la recommandation d'effectuer un scaling à la hausse ou à la baisse, vous pouvez apporter la modification recommandée pour réduire les coûts ou augmenter la fiabilité de votre cluster. Si possible, la recommandation inclut les économies ou les coûts mensuels prévus. Pour en savoir plus, consultez Comprendre les estimations de coûts ou d'économies.
GKE ne fournit pas ces insights pour les clusters Autopilot, qui entraînent des coûts opérationnels minimaux, car vous ne payez que pour les ressources demandées par vos charges de travail. Pour en savoir plus, consultez la page Tarifs du mode Autopilot.
GKE surveille vos clusters et fournit des conseils pour optimiser votre utilisation via Active Assist, un service qui fournit des outils de recommandation générant des insights et des recommandations pour l'utilisation des ressources sur Google Cloud. Pour en savoir plus sur la gestion des insights et des recommandations, consultez Optimiser votre utilisation de GKE avec des insights et des recommandations.
Obtenir des insights et des recommandations pour les clusters sous-provisionnés et surprovisionnés
GKE affiche ces insights et recommandations aux emplacements suivants de la console Google Cloud :
- Page Clusters Kubernetes, aux emplacements suivants :
- Dans la liste Clusters Kubernetes, dans la colonne Notifications pour les clusters concernés
- Bannières de notification sur la page Clusters pour un cluster spécifique
- Hub FinOps
Les recommandations portent les titres suivants sur la page Clusters Kubernetes :
- Clusters surprovisionnés : "Réduisez les ressources du cluster pour réduire les coûts"
- Clusters sous-provisionnés : "Augmentez les ressources du cluster pour améliorer sa fiabilité"
Vous pouvez également recevoir ces insights et recommandations via la Google Cloud CLI ou l'API Recommender, en utilisant les sous-types CLUSTER_UNDERPROVISIONED
et CLUSTER_OVERPROVISIONED
.
Suivez les instructions pour afficher des insights et des recommandations.
Après avoir identifié les clusters sous-provisionnés ou surprovisionnés, consultez les considérations relatives au redimensionnement des clusters.
Comment GKE identifie les clusters sous-provisionnés et surprovisionnés
Le tableau suivant décrit les signaux utilisés par GKE pour identifier les clusters sous-provisionnés et surprovisionnés qui peuvent être mis à l'échelle ou réduits, ainsi que le seuil de chaque signal. Ce tableau indique également l'action que nous vous recommandons d'effectuer dans ce scénario.
Sous-type | Signal | Période d'observation | Détails | Recommandation |
---|---|---|---|---|
CLUSTER_UNDERPROVISIONED |
L'utilisation du processeur ou de la mémoire est élevée | 30 derniers jours | Un cluster GKE est sous-provisionné lorsque l'utilisation du processeur et de la mémoire est en moyenne supérieure à 80 % chaque heure, au cours des 30 derniers jours. | Faites évoluer votre cluster pour améliorer sa fiabilité |
CLUSTER_OVERPROVISIONED |
L'utilisation du processeur et de la mémoire est faible | 30 derniers jours | Un cluster GKE est surprovisionné lorsque l'utilisation du processeur et de la mémoire se situe en moyenne entre 7 % et 20 % chaque heure, au cours des 30 derniers jours. | Réduire la taille de votre cluster pour économiser de l'argent |
GKE n'envoie pas de recommandations pour les clusters créés il y a moins de 30 jours.
Comprendre les estimations de coûts ou d'économies
Si possible, la recommandation de GKE inclut une estimation du coût ou des économies mensuels si vous redimensionnez le cluster. Cette estimation est basée sur les coûts du cluster pour les 30 derniers jours.
Les coûts ou économies estimés sont des projections basées sur les dépenses précédentes. Ils ne garantissent pas les coûts ou économies futurs.
Pour afficher ces estimations, assurez-vous de disposer de l'autorisation billing.accounts.getSpendingInformation
requise pour obtenir des informations sur les dépenses. Pour en savoir plus, consultez Accès à Cloud Billing.
Pour en savoir plus sur le coût de tous vos clusters GKE, y compris une répartition plus précise basée sur les espaces de noms et les charges de travail, consultez Obtenir des insights clés sur les dépenses pour l'allocation de ressources et les coûts de cluster GKE.
Pour en savoir plus sur les coûts d'exécution d'un cluster GKE, consultez Tarifs de GKE.
Éléments à prendre en compte lors du redimensionnement des clusters
Avant de suivre une recommandation pour augmenter ou réduire la capacité d'un cluster, tenez compte des éléments suivants :
- Examinez l'utilisation des ressources des applications exécutées sur votre cluster pour voir comment elles fonctionnent et si elles utilisent plus ou moins de processeur et de mémoire que prévu. Pour obtenir des instructions, consultez Analyser les demandes de ressources.
- Les charges de travail de traitement par lot peuvent intentionnellement maintenir une utilisation élevée des ressources du cluster pour réduire les coûts. Si les ressources de cluster allouées sont suffisantes pour les jobs par lot exécutés sur le cluster, vous n'avez pas besoin de mettre à l'échelle le cluster fortement utilisé, qui a été identifié comme sous-provisionné.
Mettre en œuvre la recommandation pour redimensionner un cluster
Consultez les informations suivantes pour comprendre comment ajuster la taille d'un cluster afin de mieux correspondre à votre utilisation des ressources.
Redimensionner un cluster sous-provisionné
Pour mettre en œuvre la recommandation visant à minimiser le risque de problèmes de fiabilité en dimensionnant correctement un cluster sous-provisionné, augmentez les ressources du cluster. Pour ce faire, vous pouvez effectuer les actions suivantes :
- Activez l'autoscaler de cluster et le provisionnement automatique des nœuds, ou ajustez les paramètres pour permettre un scaling-up plus important.
- Mettez à l'échelle horizontalement votre cluster en augmentant le nombre de nœuds. Suivez les instructions pour effectuer un scaling horizontal en modifiant le nombre de nœuds.
- Choisissez un type de machine plus grand pour vos pools de nœuds. Suivez les instructions pour effectuer un scaling vertical en modifiant les attributs de machine des nœuds.
- Surveillez et examinez l'utilisation des ressources de processeur et de mémoire des applications qui s'exécutent sur votre cluster. Vérifiez si vous pouvez réduire la taille des applications. Pour obtenir des instructions sur la surveillance de l'utilisation des ressources, consultez Analyser les demandes de ressources.
Lorsque vous implémentez cette recommandation, vous vous assurez que votre cluster reste fiable, car il dispose de la quantité appropriée de ressources pour ses applications.
Redimensionner un cluster surprovisionné
Pour mettre en œuvre la recommandation visant à réduire les coûts en dimensionnant correctement un cluster surprovisionné, diminuez les ressources du cluster. Ajustez les allocations de CPU et de mémoire du cluster en fonction des besoins de votre charge de travail. Pour ce faire, vous pouvez effectuer les actions suivantes :
- Ajustez l'autoscaler de cluster et le provisionnement automatique des nœuds pour effectuer un scaling à la baisse plus radical des ressources sous-utilisées.
- Réduisez horizontalement la taille de votre cluster en diminuant le nombre de nœuds. Suivez les instructions pour effectuer un scaling horizontal en modifiant le nombre de nœuds.
- Choisissez un type de machine plus petit pour vos pools de nœuds. Suivez les instructions pour effectuer un scaling vertical en modifiant les attributs de machine des nœuds.
- Surveillez et examinez l'utilisation des ressources de processeur et de mémoire des applications qui s'exécutent sur votre cluster. Vérifiez si vous pouvez effectuer un scaling à la hausse des applications. Pour savoir comment surveiller l'utilisation des ressources, consultez Analyser les demandes de ressources.
Lorsque vous implémentez cette recommandation, vous vous assurez de ne pas utiliser plus de ressources que nécessaire pour exécuter les applications de votre cluster.
Étapes suivantes
- Afficher les métriques d'optimisation liées aux coûts
- Réduire les coûts en effectuant un scaling à la baisse des clusters GKE pendant les heures creuses
- Optimisez votre utilisation de GKE en exploitant les insights et les recommandations.
- Bonnes pratiques pour l'exécution d'applications Kubernetes à coût maîtrisé sur GKE
- 5 fonctionnalités GKE pour vous aider à optimiser vos clusters