Intervalles de maintenance et exclusions

Cette page décrit les intervalles de maintenance et les exclusions de maintenance qui permettent de contrôler à quel moment les tâches de maintenance, telle que les mises à jour automatiques, peuvent être effectuées sur vos clusters Google Kubernetes Engine (GKE). Par exemple, une entreprise de vente au détail peut limiter les tâches de maintenance aux soirs de semaine et empêcher la maintenance automatique lors d'un événement commercial majeur.

Présentation

Les intervalles et les exclusions de maintenance permettent de contrôler avec précision les tâches de maintenance automatique sur vos clusters.

Un intervalle de maintenance est une période arbitraire récurrente pendant laquelle la maintenance automatique est autorisée.

Une exclusion de maintenance est une période arbitraire non récurrente pendant laquelle la maintenance automatique est interdite. Un cluster peut comporter jusqu'à trois exclusions de maintenance à la fois.

Les intervalles et les exclusions de maintenance peuvent être configurés de manière distincte et indépendante. Vous pouvez configurer plusieurs exclusions de maintenance.

.

Exemples de maintenance automatique

Google effectue des tâches de maintenance sur vos clusters en fonction des besoins, ou lorsque vous effectuez une modification de configuration qui recrée des nœuds ou des réseaux dans le cluster, par exemple :

Les clusters zonaux ne peuvent pas être modifiés lors des modifications de la configuration du plan de contrôle et des mises à niveau automatiques des clusters. Cela inclut le déploiement de charges de travail.

Chacun des autres types de modifications répertoriés ci-dessus peut entraîner des interruptions temporaires lors du retrait des charges de travail de chaque nœud lors de sa recréation.

Intervalles de maintenance

Les intervalles de maintenance permettent de contrôler les mises à jour automatiques des plans de contrôle et des nœuds afin de limiter les interruptions transitoires potentielles de vos charges de travail. Les intervalles de maintenance s'avèrent utiles dans certains types de scénarios, parmi lesquels :

  • Heures creuses : vous souhaitez réduire les risques de temps d'arrêt en planifiant des mises à jour automatiques pendant les heures creuses, lorsque le trafic est réduit.
  • Heures de travail : vous tenez à ce que les mises à niveau aient lieu pendant les heures de travail, afin que quelqu'un puisse les surveiller et gérer tout problème imprévu.
  • Mises à niveau multicluster : vous souhaitez déployer les mises à niveau sur plusieurs clusters situés dans différentes régions, à raison d'une à la fois et durant des intervalles spécifiés.

En plus des mises à jour automatiques, Google peut parfois avoir besoin d'effectuer d'autres tâches de maintenance. Il est alors tenu compte, dans la mesure du possible, des intervalles de maintenance des clusters.

Si l'exécution des tâches dépasse l'intervalle de maintenance, GKE tente de les mettre en pause et de les reprendre lors de l'intervalle de maintenance suivant.

GKE se réserve le droit de déployer des mises à niveau d'urgence non planifiées en dehors des intervalles de maintenance. En outre, les mises à niveau obligatoires des logiciels obsolètes peuvent se produire automatiquement en dehors des intervalles de maintenance.

Pour savoir comment configurer un intervalle de maintenance pour un cluster nouveau ou existant, consultez la page Configurer un intervalle de maintenance.

Mise en garde à propos des intervalles de maintenance

Les intervalles et les exclusions de maintenance peuvent entraîner un retard dans l'application des correctifs de sécurité. GKE se réserve le droit de remplacer les règles de maintenance afin de corriger les failles de sécurité critiques. Avant d'activer des intervalles de maintenance, assurez-vous de bien comprendre les mises en garde suivantes.

Autres opérations de maintenance de Google Cloud

Les clusters et les charges de travail GKE peuvent également être affectés par la maintenance automatique sur d'autres services dépendants, tels que Compute Engine. Les intervalles et les exclusions de maintenance de GKE n'affectent pas la maintenance automatique sur d'autres services.

Réparations automatiques et redimensionnement

GKE effectue des réparations automatiques sur les plans de contrôle. Cela inclut des processus tels que le redimensionnement de la VM du plan de contrôle à une taille adaptée ou le redémarrage du plan de contrôle pour résoudre des problèmes. La plupart des réparations ignorent les intervalles et les exclusions de maintenance, car l'échec des réparations peut entraîner un dysfonctionnement des clusters. La réparation automatique des plans de contrôle ne peut pas être désactivée.

Les nœuds offrent également une fonctionnalité de réparation automatique, mais celle-ci peut être désactivée.

Recréation des nœuds et intervalles de maintenance

Lorsque vous activez ou modifiez des fonctionnalités ou des options, comme celles qui ont une incidence sur la mise en réseau entre les plans de contrôle et les nœuds, ces nœuds sont recréés afin d'appliquer la nouvelle configuration. Voici quelques exemples de fonctionnalités qui entraînent la recréation des nœuds :

Si vous utilisez des intervalles de maintenance et que vous activez ou modifiez une fonctionnalité ou une option nécessitant la recréation de nœuds, la nouvelle configuration n'est appliquée aux nœuds que pendant un intervalle de maintenance. Pour éviter d'attendre, vous pouvez appliquer manuellement les modifications aux nœuds en appelant la commande gcloud container clusters upgrade et en transmettant l'option --cluster-version avec la même version de GKE que celle exécutée par le pool de nœuds. Vous devez utiliser l'outil de ligne de commande gcloud pour résoudre ce problème.

Un seul intervalle de maintenance par cluster

Vous ne pouvez configurer qu'un seul intervalle de maintenance par cluster. La configuration d'un nouvel intervalle de maintenance remplace la configuration précédente.

Fuseaux horaires des intervalles de maintenance

Lorsque vous configurez et affichez des intervalles de maintenance, les heures s'affichent différemment selon l'outil employé pour les consulter :

Lors de la configuration des intervalles de maintenance

Si vous configurez des intervalles de maintenance à l'aide de l'option plus générique --maintenance- window, vous ne pouvez pas spécifier de fuseau horaire. Si vous utilisez l'outil gcloud ou l'API, le temps UTC s'applique. Si vous utilisez Google Cloud Console, les heures sont affichées dans le fuseau horaire local.

Si vous utilisez des options plus précises, telles que --maintenance-window-start, vous pouvez spécifier le fuseau horaire dans la valeur. Si vous omettez le fuseau horaire, votre fuseau horaire local est utilisé. Les heures sont toujours stockées en temps UTC.

Lors de l'affichage des intervalles de maintenance

Lorsque vous affichez les informations sur votre cluster, les horodatages des intervalles de maintenance peuvent s'afficher en temps UTC ou dans votre fuseau horaire local, selon l'outil utilisé pour les consulter :

  • Si vous consultez les informations du cluster dans Google Cloud Console, les heures sont toujours affichées dans votre fuseau horaire local.
  • Lorsque vous utilisez l'outil gcloud pour afficher les informations de votre cluster, les heures sont toujours affichées en temps UTC.

Dans les deux cas, RRULE est toujours au format UTC. Cela signifie que si vous spécifiez, par exemple, les jours de la semaine, ces jours sont affichés au format UTC.

Exclusions de maintenance

Les exclusions de maintenance vous permettent d'empêcher la maintenance automatique pendant une période spécifique. Par exemple, de nombreuses entreprises de vente au détail interdisent les modifications d'infrastructure pendant les fêtes de fin d'année dans leurs consignes commerciales. Pour les événements connus à fort impact, il est recommandé de faire correspondre toutes les restrictions de modification interne avec une exclusion de maintenance commençant une semaine avant l'événement et pendant toute la durée de l'événement.

Vous pouvez ajouter jusqu'à trois exclusions. Vous devez laisser à Google suffisamment de temps pour gérer vos clusters de façon à conserver une configuration compatible.

Les exclusions ne sont pas récurrentes. Vous devez donc créer chaque instance d'exclusion périodique séparément.

Pour apprendre à configurer des exclusions de maintenance pour un cluster nouveau ou existant, consultez la page Configurer une exclusion de maintenance.

Étapes suivantes