Intervalles de maintenance et exclusions

Cette page décrit les intervalles de maintenance et les exclusions de maintenance qui permettent de contrôler à quel moment les tâches de maintenance, telle que les mises à jour automatiques, peuvent être effectuées sur vos clusters Google Kubernetes Engine. Par exemple, une entreprise de vente au détail peut limiter les tâches de maintenance aux soirs de semaine et empêcher la maintenance automatique lors d'un événement commercial majeur.

Présentation

Les intervalles et les exclusions de maintenance permettent désormais de contrôler avec précision les tâches de maintenance automatique sur vos clusters.

Un intervalle de maintenance est une période arbitraire récurrente pendant laquelle la maintenance automatique est autorisée.

Une exclusion de maintenance est une période arbitraire non récurrente pendant laquelle la maintenance automatique est interdite. Un cluster peut comporter jusqu'à trois exclusions de maintenance à la fois.

Les intervalles et les exclusions de maintenance peuvent être configurés de manière distincte et indépendante. Vous pouvez configurer plusieurs exclusions de maintenance.

Exemples de maintenance automatique

Google effectue des tâches de maintenance sur vos clusters en fonction des besoins, ou lorsque vous effectuez une modification de configuration qui recrée des nœuds ou des réseaux dans le cluster. Exemple :

Certains de ces types de maintenance, comme les mises à niveau de cluster et de nœuds, peuvent être difficiles à prévoir et à planifier. Un cluster zonal ne peut pas être modifié pendant la mise à jour de son plan de contrôle, y compris du déploiement des charges de travail. Chacun des autres types de modifications répertoriés ci-dessus peut entraîner des interruptions temporaires lors du retrait des charges de travail de chaque nœud lors de sa recréation.

Intervalles de maintenance

Les intervalles de maintenance permettent de contrôler les mises à jour automatiques des plans de contrôle et des nœuds afin de limiter les interruptions transitoires potentielles de vos charges de travail. Les intervalles de maintenance s'avèrent utiles dans certains types de scénarios, parmi lesquels :

  • Heures creuses : vous souhaitez réduire les risques de temps d'arrêt en planifiant des mises à jour automatiques pendant les heures creuses, lorsque le trafic est réduit.
  • Heures de travail : vous tenez à ce que les mises à niveau aient lieu pendant les heures de travail, afin que quelqu'un puisse les surveiller et gérer tout problème imprévu.
  • Mises à niveau multicluster : vous souhaitez déployer les mises à niveau sur plusieurs clusters situés dans différentes régions, à raison d'une à la fois et durant des intervalles spécifiés.

En plus des mises à jour automatiques, Google peut parfois avoir besoin d'effectuer d'autres tâches de maintenance. Il est alors tenu compte, dans la mesure du possible, des intervalles de maintenance des clusters.

Si l'exécution des tâches dépasse l'intervalle de maintenance, GKE tente de mettre l'opération en pause et de la réactiver lors de l'intervalle suivante.

GKE se réserve le droit de déployer des mises à niveau d'urgence non planifiées en dehors des intervalles de maintenance. En outre, les mises à niveau obligatoires pour mettre à niveau des logiciels obsolètes peuvent se produire automatiquement en dehors des intervalles de maintenance.

Il est possible de configurer un intervalle de maintenance pour un cluster nouveau ou existant.

Mise en garde à propos des intervalles de maintenance

Les intervalles et les exclusions de maintenance peuvent entraîner un retard dans l'application des correctifs de sécurité. GKE se réserve le droit de remplacer les règles de maintenance en cas de failles de sécurité critiques. Avant d'activer des intervalles de maintenance, assurez-vous de bien comprendre les mises en garde suivantes.

Autres opérations de maintenance de Google Cloud

Les clusters et les charges de travail GKE peuvent également être affectés par la maintenance automatique sur d'autres services dépendants, tels que Compute Engine. Les intervalles et les exclusions de maintenance n'affectent pas la maintenance automatique sur d'autres services.

Réparations automatiques et redimensionnement

GKE effectue des réparations automatiques sur les plans de contrôle. Cela inclut des processus tels que le redimensionnement de la VM du plan de contrôle à une taille adaptée ou le redémarrage du plan de contrôle pour résoudre des problèmes. La plupart des réparations ignorent les intervalles et les exclusions de maintenance, car l'échec des réparations peut entraîner un dysfonctionnement des clusters. La réparation automatique des plans de contrôle ne peut pas être désactivée.

Les nœuds offrent également une fonctionnalité de réparation automatique, mais celle-ci peut être désactivée.

Recréation des nœuds et intervalles de maintenance

Lorsque vous activez ou modifiez des fonctionnalités ou des options, comme celles qui ont une incidence sur la mise en réseau entre les plans de contrôle et les nœuds, ces nœuds sont recréés afin d'appliquer la nouvelle configuration. Voici quelques exemples de fonctionnalités qui entraînent la recréation des nœuds :

Si vous utilisez des intervalles de maintenance et que vous activez ou modifiez une fonctionnalité ou une option nécessitant la recréation de nœuds, la nouvelle configuration n'est appliquée aux nœuds que pendant un intervalle de maintenance. Pour éviter d'attendre, vous pouvez "mettre à jour" manuellement le pool de nœuds avec la version déjà utilisée en définissant l'option --cluster-version sur la même version GKE que celle que les nœuds exécutent. Si vous optez pour cette solution, vous devez exécuter la commande gcloud.

Un seul intervalle de maintenance par cluster

Vous ne pouvez configurer qu'un seul intervalle de maintenance par cluster. La configuration d'un nouvel intervalle de maintenance remplace la configuration précédente.

Fuseaux horaires des intervalles de maintenance

Lorsque vous configurez et affichez des intervalles de maintenance, les heures s'affichent différemment selon l'outil employé pour les consulter :

Lors de la configuration des intervalles de maintenance

Si vous configurez des intervalles de maintenance à l'aide de l'ancienne option --maintenance-window, vous ne pouvez pas spécifier de fuseau horaire. Si vous utilisez la commande gcloud ou l'API, le temps UTC s'applique. Si vous utilisez Google Cloud Console, les heures sont affichées dans le fuseau horaire local.

Si vous utilisez des options plus précises, telles que --maintenance-window-start, vous pouvez intégrer le fuseau horaire dans la valeur spécifiée. Si vous omettez le fuseau horaire, votre fuseau horaire local est utilisé. Les heures sont toujours stockées en temps UTC.

Lors de l'affichage des intervalles de maintenance

Lorsque vous affichez les informations sur votre cluster, les horodatages des intervalles de maintenance peuvent s'afficher en temps UTC ou dans votre fuseau horaire local, selon l'outil utilisé pour les consulter :

  • Si vous consultez les informations du cluster dans Google Cloud Console, les heures sont toujours affichées dans votre fuseau horaire local.
  • Lorsque vous utilisez gcloud pour afficher les informations de votre cluster, les heures sont toujours affichées en temps UTC.

Exclusions de maintenance

Les exclusions de maintenance vous permettent d'empêcher la maintenance automatique pendant une période spécifique. Par exemple, de nombreuses entreprises de vente au détail interdisent les modifications d'infrastructure pendant les fêtes de fin d'année dans leurs consignes commerciales.

Vous pouvez ajouter jusqu'à trois exclusions. Vous devez laisser à Google suffisamment de temps pour gérer vos clusters de façon à conserver une configuration compatible.

Les exclusions ne sont pas récurrentes. Vous devez donc créer chaque instance d'exclusion périodique séparément.

Vous pouvez configurer une exclusion de maintenance pour un cluster nouveau ou existant.

Étape suivante