Maintenance et mises à jour du cloud privé

Les environnements de cloud privé sont conçus pour ne pas comporter de point de défaillance unique:

  • Les clusters ESXi sont configurés avec la haute disponibilité vSphere (HA). Les clusters sont dimensionnés de manière à disposer d'au moins un nœud de secours pour la résilience.
  • vSAN fournit un espace de stockage principal redondant, qui requiert au moins trois nœuds pour assurer une protection contre une seule défaillance. Pour les clusters plus importants, vous pouvez configurer vSAN afin d'augmenter la résilience.
  • Les machines virtuelles vCenter, PSC et NSX Manager sont configurées avec un stockage RAID-10 afin d'éviter toute défaillance de stockage. Les VM sont également protégées contre les défaillances de nœud et de réseau par vSphere HA.
  • Les hôtes ESXi ont des ventilateurs et des cartes d'interface réseau redondants.
  • Les commutateurs TOR et centraux sont configurés par paires haute disponibilité pour assurer la résilience.

VMware Engine surveille en permanence le temps d'activité et fournit des contrats de niveau de service pour les types de VM suivants:

  • Hôtes ESXi
  • vCenter
  • PSC
  • NSX Manager

VMware Engine surveille en permanence les défaillances dans éléments suivants :

  • Disques durs
  • Ports de carte d'interface réseau physiques
  • Serveurs
  • Ventilateurs
  • Alimentation
  • Commutateurs
  • Ports du commutateur

En cas de défaillance d'un disque ou d'un nœud, VMware Engine ajoute immédiatement et automatiquement un nouveau nœud au cluster VMware concerné pour restaurer l'opérabilité du service.

Les éléments VMware suivants dans les clouds privés sont sauvegardés, conservés et mis à jour :

  • ESXi
  • vCenter Platform Services Controller
  • vSAN
  • NSX

Sauvegarde et restauration

Les sauvegardes incluent les éléments suivants:

  • Sauvegardes nocturnes des règles vCenter, PSC et DMS
  • API vCenter natives pour sauvegarder les composants au niveau de la couche d'application
  • Sauvegarde automatique avant la mise à jour ou la mise à niveau du logiciel de gestion VMware

Maintenance

Les types de maintenance planifiée suivants sont inclus :

Maintenance interne et backend

La maintenance interne et backend implique généralement de reconfigurer les ressources physiques ou d'installer des correctifs logiciels. Elle n'a pas d'incidence sur la consommation normale des ressources concernées. Les cartes d'interface réseau redondantes adressées à chaque rack physique, le trafic réseau normal et les opérations dans le cloud privé ne sont pas affectés. Vous ne remarquerez peut-être un impact sur les performances que si votre organisation s'attend à utiliser la bande passante redondante complète pendant l'intervalle de maintenance.

Maintenance du portail

Certains temps d'arrêt de service limités sont requis lorsque le plan de contrôle ou l'infrastructure est mis à jour. Les intervalles de maintenance peuvent être aussi fréquents qu'une fois par mois, et cette fréquence devrait diminuer au fil du temps. VMware Engine vous informe de la maintenance imminente du portail et fait son possible pour que l'intervalle de maintenance soit aussi court que possible. Pendant un intervalle de maintenance du portail, les services suivants continuent de fonctionner sans aucune incidence :

  • Plan de gestion et applications VMware
  • Accès à vCenter
  • Mise en réseau et stockage

Maintenance de l'infrastructure VMware

Il est parfois nécessaire de modifier la configuration de l'infrastructure VMware. Cette modification peut se produire tous les mois voire tous les deux mois, pour s'espacer ensuite au fil du temps. Ce type de maintenance peut généralement être effectué sans interrompre la consommation normale du cloud privé. Lors d'un intervalle de maintenance VMware, les services suivants continuent de fonctionner sans aucun impact :

  • Plan de gestion et applications VMware
  • Accès à vCenter
  • Mise en réseau et stockage

Mises à jour et mises à niveau

VMware Engine est responsable de la gestion du cycle de vie des logiciels VMware (ESXi, vCenter, PSC et NSX) dans les clouds privés.

Les mises à jour logicielles incluent les suivantes :

  • Des correctifs : correctifs de sécurité ou corrections de bugs publiés par VMware
  • Des mises à jour : modification de la version mineure d'un composant de la pile VMware
  • Des mises à niveau : modification majeure de la version d'un composant de la pile VMware

VMware Engine teste les correctifs de sécurité critiques dès qu'ils sont disponibles dans VMware. Conformément au contrat de niveau de service, VMware Engine cible un déploiement de correctifs de sécurité dans les environnements cloud privés dans un délai d'une semaine suivant leur disponibilité.

Lorsqu'une nouvelle version majeure des logiciels VMware est disponible, VMware Engine collabore avec ses clients pour coordonner un intervalle de maintenance adapté à l'application de la mise à niveau. VMware Engine applique les mises à niveau des versions majeures au moins six mois après la publication de la version majeure et avertit les clients un mois à l'avance de l'application des mises à niveau de version majeures.

VMware Engine collabore également avec les principaux fournisseurs du secteur pour s'assurer qu'ils sont compatibles avec la dernière version des logiciels VMware avant de procéder à une mise à niveau de version majeure. Pour en savoir plus sur l'assistance de fournisseurs spécifiques, contactez Cloud Customer Care.

Préparation

Google recommande de prendre les dispositions suivantes avant de lancer une mise à jour ou une mise à niveau:

  • Vérifiez la capacité de stockage:assurez-vous que l'utilisation de l'espace de stockage de votre cluster vSphere est inférieure à 80% pour respecter le Contrat de niveau de service. Si l'utilisation est supérieure à 80%, les mises à niveau peuvent prendre plus de temps que d'habitude ou échouer complètement. Si votre utilisation du stockage est supérieure à 70%, ajoutez un nœud pour développer le cluster et éviter tout temps d'arrêt potentiel lors des mises à niveau.
  • Modifier les règles de stockage vSAN avec un FTT de 0:remplacez les VM configurées avec une règle de stockage vSAN pour les pannes à tolérer (FTT) de 0 par une règle de stockage vSAN avec un FTT de 1 afin de maintenir le contrat de niveau de service.
  • Supprimer les installations de CD de VM:supprimez tous les CD installés sur vos VM de charge de travail qui ne sont pas compatibles avec vMotion.
  • Procédez à l'installation des outils VMware:effectuez toutes les installations ou mises à niveau des outils VMware avant le début de la mise à niveau planifiée.
  • Supprimez le partage de bus SCSI sur les VM : supprimez le partage de bus SCSI sur les VM si vous ne souhaitez pas qu'elles soient éteintes.
  • Supprimer les VM et les datastores inaccessibles:supprimez les VM orphelines et inaccessibles de l'inventaire vCenter. Supprimez tous les datastores externes inaccessibles.
  • Désactivez les règles DRS : les règles DRS permettant d'épingler une VM à un hôte empêchent le nœud de passer en mode de maintenance. Vous pouvez désactiver les règles DRS avant la mise à niveau et les activer une fois la mise à niveau terminée.
  • Mettez à jour les modules complémentaires VMware et les solutions tierces:vérifiez que les modules complémentaires VMware et les solutions tierces déployés sur votre cloud privé vCenter sont compatibles avec les versions post-mise à niveau mentionnées précédemment. Il peut s'agir, par exemple, d'outils de sauvegarde, de surveillance, d'orchestration de reprise après sinistre et d'autres fonctions similaires. Contactez le fournisseur de la solution et procédez à la mise à jour à l'avance si nécessaire pour garantir la compatibilité après la mise à niveau.

Configurations pouvant affecter les processus de maintenance

VMware Engine exploite le mode maintenance de VMware pour effectuer les mises à niveau, les mises à jour et la maintenance des nœuds. Cela permet d'assurer la continuité du fonctionnement de vos charges de travail de cloud privé. Toutefois, les configurations suivantes peuvent nécessiter des étapes supplémentaires avant qu'un nœud puisse passer en mode maintenance:

  • Règles DRS:DOIVENT règles qui obligent les VM à rester sur un nœud spécifique.
  • Partage de bus SCSI:VM configurées pour partager des bus SCSI.
  • Montages de CD-ROM:VM avec des CD-ROM connectés, en particulier si ces CD-ROM ne peuvent pas être déplacés vers un autre nœud à l'aide de vMotion.
  • Connexions au port série:VM utilisant des connexions via le port série qui empêchent leur transfert vers un autre nœud à l'aide de vMotion.
  • Raw device mappings (Mappages d'appareils bruts) : VM accédant directement à des appareils de stockage physiques.

Si une action est nécessaire

Si l'une de ces configurations existe sur un nœud, Cloud Customer Care vous avertit au moins 24 heures avant de prendre les mesures correctives requises pour maintenir la disponibilité de votre cloud privé. Dans certains cas, des étapes telles que la mise hors tension d'une VM, son déplacement avec vMotion et sa mise sous tension, ou la suppression des CD-ROM, peuvent perturber brièvement votre charge de travail.

Étapes suivantes