Maintenance et mises à jour du cloud privé

Les environnements de cloud privé sont conçus de différentes manières pour ne pas avoir point de défaillance:

  • Les clusters ESXi sont configurés avec la haute disponibilité vSphere (HA). Les clusters sont dimensionnés de manière à disposer d'au moins un nœud de secours pour la résilience.
  • vSAN fournit un espace de stockage principal redondant, qui requiert au moins trois nœuds pour assurer une protection contre une seule défaillance. Pour les clusters plus importants, vous pouvez configurer vSAN afin d'augmenter la résilience.
  • Les machines virtuelles vCenter, PSC et NSX Manager sont configurées avec un stockage RAID-10 afin d'éviter toute défaillance de stockage. Les VM sont également protégées contre les défaillances de nœud et de réseau par vSphere HA.
  • Les hôtes ESXi ont des ventilateurs et des cartes d'interface réseau redondants.
  • Les commutateurs TOR et centraux sont configurés par paires haute disponibilité pour assurer la résilience.

VMware Engine surveille en permanence le temps d'activité et la disponibilité, et fournit des contrats de niveau de service de disponibilité pour les types de VM suivants:

  • Hôtes ESXi
  • vCenter
  • PSC
  • NSX Manager

VMware Engine surveille en permanence les défaillances dans éléments suivants :

  • Disques durs
  • Ports de carte d'interface réseau physiques
  • Serveurs
  • Ventilateurs
  • Alimentation
  • Commutateurs
  • Ports du commutateur

En cas de défaillance d'un disque ou d'un nœud, VMware Engine ajoute immédiatement et automatiquement un nouveau nœud au cluster VMware concerné pour restaurer l'opérabilité du service.

Les éléments VMware suivants dans les clouds privés sont sauvegardés, conservés et mis à jour :

  • ESXi
  • vCenter Platform Services Controller
  • vSAN
  • NSX

Sauvegarde et restauration

Les sauvegardes incluent les éléments suivants:

  • Sauvegardes nocturnes des règles vCenter, PSC et DMS
  • API vCenter natives pour sauvegarder les composants au niveau de la couche d'application
  • Sauvegarde automatique avant la mise à jour ou la mise à niveau du logiciel de gestion VMware

Maintenance

Les types de maintenance planifiée suivants sont inclus :

Maintenance interne et backend

La maintenance interne et backend implique généralement de reconfigurer les ressources physiques ou d'installer des correctifs logiciels. Elle n'a pas d'incidence sur la consommation normale des ressources concernées. Les cartes d'interface réseau redondantes adressées à chaque rack physique, le trafic réseau normal et les opérations dans le cloud privé ne sont pas affectés. Vous ne remarquerez peut-être un impact sur les performances que si votre organisation s'attend à utiliser la bande passante redondante complète pendant l'intervalle de maintenance.

Maintenance du portail

Certains temps d'arrêt de service limités sont requis lorsque le plan de contrôle ou l'infrastructure est mis à jour. Les intervalles de maintenance peuvent être aussi fréquents qu'une fois par mois, et cette fréquence devrait diminuer au fil du temps. VMware Engine vous informe de la maintenance imminente du portail et fait son possible pour que l'intervalle de maintenance soit aussi court que possible. Pendant un intervalle de maintenance du portail, les services suivants continuent de fonctionner sans aucune incidence :

  • Plan de gestion et applications VMware
  • Accès à vCenter
  • Mise en réseau et stockage

Maintenance de l'infrastructure VMware

Il est parfois nécessaire de modifier la configuration de l'infrastructure VMware. Cette modification peut se produire tous les mois voire tous les deux mois, pour s'espacer ensuite au fil du temps. Ce type de maintenance peut généralement être effectué sans interrompre la consommation normale du cloud privé. Lors d'un intervalle de maintenance VMware, les services suivants continuent de fonctionner sans aucun impact :

  • Plan de gestion et applications VMware
  • Accès à vCenter
  • Mise en réseau et stockage

Mises à jour et mises à niveau

VMware Engine est responsable de la gestion du cycle de vie des logiciels VMware (ESXi, vCenter, PSC et NSX) dans les clouds privés.

Les mises à jour logicielles incluent les suivantes :

  • Des correctifs : correctifs de sécurité ou corrections de bugs publiés par VMware
  • Des mises à jour : modification de la version mineure d'un composant de la pile VMware
  • Des mises à niveau : modification majeure de la version d'un composant de la pile VMware

VMware Engine teste les correctifs de sécurité critiques dès qu'ils sont disponibles dans VMware. Conformément au contrat de niveau de service, VMware Engine cible un déploiement de correctifs de sécurité à des environnements cloud privés dans la semaine la disponibilité.

Lorsqu'une nouvelle version majeure des logiciels VMware est disponible, VMware Engine collabore avec ses clients pour coordonner un intervalle de maintenance adapté à l'application de la mise à niveau. VMware Engine s'applique des mises à niveau vers une version majeure au moins six mois après la sortie de la version majeure ; et informe les clients un mois à l'avance de l'application des mises à niveau vers une version majeure.

VMware Engine collabore également avec les principaux fournisseurs du secteur pour s'assurer qu'ils sont compatibles avec la dernière version des logiciels VMware avant de procéder à une mise à niveau de version majeure. Pour plus d'informations concernant l'assistance de fournisseurs spécifiques, contactez Cloud Customer Care

Responsabilité de la mise à jour des certificats

Les mises à jour de certificats relèvent de la responsabilité de Google. Si vous obtenez un certificat erreur de mise à jour, aucune action n'est requise et le certificat est renouvelé avant la date d'expiration. Toutefois, si LDAPS est configuré dans votre cloud privé, seul responsable du certificat spécifique associé à cette erreur.

Préparation

Google recommande de prendre les mesures suivantes avant de lancer une mise à jour : mise à niveau:

  • Vérifiez la capacité de stockage:assurez-vous que l'espace de stockage de votre cluster vSphere est inférieure à 80% pour respecter le SLA. Si l'utilisation est supérieure à 80%, les mises à niveau peuvent prendre plus de temps que d'habitude ou échouer complètement. Si votre utilisation du stockage est supérieure à 70%, ajoutez un nœud pour développer le cluster et éviter tout risque pendant les mises à niveau.
  • Modifier les règles de stockage vSAN avec un FTT de 0:modifiez les VM configurées avec un Règle de stockage vSAN pour les échecs de tolérance (FTT) de 0 vers un stockage vSAN avec un FTT de 1 pour maintenir le SLA.
  • Supprimez les installations de CD de VM:supprimez tous les CD installés sur vos VM de charge de travail qui ne sont pas compatibles avec vMotion.
  • Effectuez des installations d'outils VMware:terminez les installations ou des outils VMware avant le début de la mise à niveau planifiée.
  • Supprimez le partage de bus SCSI sur les VM : supprimez le partage de bus SCSI sur les VM si vous ne souhaitez pas qu'elles soient éteintes.
  • Supprimez les VM et les datastores inaccessibles:supprimez les VM et les datastores inaccessibles et inutilisés. des VM de l'inventaire vCenter. Supprimez tous les datastores externes inaccessibles.
  • Désactiver les règles DRS (Distributed Resource Scheduler):règles DRS qui épinglent un Une VM vers un hôte empêche un nœud de passer en mode maintenance. Vous pouvez désactiver les règles DRS avant la mise à niveau et les activer une fois la mise à niveau terminé.
  • Mettez à jour les modules complémentaires VMware et les solutions tierces:vérifiez que VMware les modules complémentaires et les solutions tierces déployés sur votre cloud privé vCenter compatible avec les versions post-mise à niveau mentionnées précédemment. Exemples de tels que la sauvegarde, la surveillance, l'orchestration de la reprise après sinistre, et d'autres fonctions similaires. Renseignez-vous auprès du fournisseur de la solution et faites la mise à jour à l'avance. de temps si nécessaire pour assurer la compatibilité après la mise à niveau.

Configurations pouvant affecter les processus de maintenance

VMware Engine exploite le mode maintenance de VMware pour effectuer les mises à niveau, les mises à jour et la maintenance des nœuds. Cela permet d'assurer la continuité des opérations. de vos charges de travail de cloud privé. Toutefois, les configurations suivantes peuvent nécessitent des étapes supplémentaires pour qu'un nœud puisse passer en mode maintenance:

  • Règles DRS:DOIT respecter les règles qui obligent les VM à rester sur un nœud spécifique.
  • Partage de bus SCSI:VM configurées pour partager des bus SCSI.
  • Installation de CD-ROM:VM reliées à des CD-ROM, en particulier si ces CD-ROMs ne peuvent pas être déplacés vers un autre nœud à l'aide de vMotion.
  • Connexions au port série:les VM utilisant des connexions de port série qui empêchent d'être déplacés vers un autre nœud à l'aide de vMotion.
  • Mappages d'appareils bruts (RDM) : VM accédant directement à l'espace de stockage physique appareils.

Si une action est nécessaire

Si l'une de ces configurations existe sur un nœud, Cloud Customer Care vous en informe au moins 24 heures avant de prendre les mesures correctives nécessaires pour maintenir la disponibilité de votre cloud privé. Dans certains cas, des étapes telles que l'extinction une VM, de le déplacer avec vMotion, de le mettre sous tension ou de le retirer des CD-ROM, peut perturber brièvement votre charge de travail.

Étape suivante