Wartung und Aktualisierungen der privaten Cloud

Private Cloud-Umgebungen sind so konzipiert, dass kein Single Point of Failure vorhanden ist:

  • ESXi-Cluster sind mit vSphere HA (Hochverfügbarkeit) konfiguriert. Die Cluster haben eine Größe, die zur Gewährleistung der Ausfallsicherheit mindestens einen freien Knoten bietet.
  • vSAN bietet redundanten primären Speicher, wobei mindestens drei Knoten erforderlich sind, um Schutz vor einem einzelnen Ausfall zu bieten. Bei größeren Clustern können Sie vSAN so konfigurieren, dass eine höhere Stabilität ermöglicht wird.
  • Virtuelle Maschinen (vCenter, PSC und NSX Manager) werden mit RAID-10-Speicher konfiguriert, um Speicherfehler zu verhindern. Die VMs werden zusätzlich durch vSphere HA vor Knoten- und Netzwerkausfällen geschützt.
  • ESXi-Hosts haben redundante Lüfter und NICs.
  • TOR- und Spine-Switches sind in HA-Paaren konfiguriert, um für Ausfallsicherheit zu sorgen.

VMware Engine überwacht kontinuierlich die Betriebszeit, überwacht die Verfügbarkeit und stellt Verfügbarkeits-SLAs für die folgenden VM-Typen bereit:

  • ESXi-Hosts
  • vCenter
  • PSC
  • NSX Manager

VMware Engine überwacht kontinuierlich Folgendes auf Ausfälle:

  • Festplatten
  • Ports der physischen Netzwerkkarte
  • Server
  • Lüfter
  • Stromversorgung
  • Schalter
  • Switch-Ports

Wenn ein Laufwerk oder ein Knoten ausfällt, fügt VMware Engine sofort einen entsprechenden Knoten zum betroffenen VMware-Cluster hinzu, um den Dienst wiederherzustellen.

Die folgenden VMware-Elemente in den privaten Clouds werden gesichert, verwaltet und aktualisiert:

  • ESXi
  • vCenter Platform Services Controller
  • vSAN
  • NSX

Sichern und wiederherstellen

Sicherungen umfassen Folgendes:

  • Nächtliche inkrementelle Sicherungen von vCenter-, PSC- und DVS-Regeln
  • Native vCenter-APIs zum Sichern von Komponenten auf Anwendungsebene
  • Automatische Sicherung vor der Aktualisierung oder vor Upgrades der VMware-Verwaltungssoftware

Wartung

Es gibt folgende Arten von geplanten Wartungsarbeiten:

Back-End und interne Wartung

Das Back-End und die interne Wartung umfassen in der Regel die Neukonfiguration physischer Assets oder die Installation von Software-Patches. Das hat keinen Einfluss auf die normale Nutzung der gewarteten Assets. Bei redundanten NICs zu jedem physischen Rack sind der normale Netzwerktraffic und die privaten Cloud-Vorgänge nicht betroffen. Die Leistung wird möglicherweise nur beeinträchtigt, wenn Ihre Organisation im Wartungszeitraum die volle redundante Bandbreite nutzen will.

Portalwartung

Wenn die Steuerungsebene oder Infrastruktur aktualisiert wird, ist eine Dienstausfallzeit für eine begrenzte Zeit unvermeidlich. Die Wartungen können einmal pro Monat erfolgen und werden voraussichtlich im Laufe der Zeit abnehmen. VMware Engine informiert Sie über bevorstehende Portalwartungen und versucht, das Wartungsintervall so kurz wie möglich zu halten. Während einer Portalwartung funktionieren die folgenden Dienste weiter ohne Beeinträchtigung:

  • VMware-Verwaltungsebene und -Anwendungen
  • vCenter-Zugriff
  • Alle Netzwerke und Speicher

VMware-Infrastruktur warten

Gelegentlich müssen Änderungen an der Konfiguration der VMware-Infrastruktur vorgenommen werden. Diese Intervalle können alle ein bis zwei Monate auftreten, aber die Häufigkeit wird mit der Zeit voraussichtlich abnehmen. Diese Art der Wartung kann in der Regel durchgeführt werden, ohne die normale Nutzung der privaten Cloud zu unterbrechen. Während eines VMware-Wartungsintervalls funktionieren die folgenden Dienste weiter ohne Beeinträchtigung:

  • VMware-Verwaltungsebene und -Anwendungen
  • vCenter-Zugriff
  • Alle Netzwerke und Speicher

Aktualisierungen und Upgrades

Die VMware Engine ist für die Lebenszyklusverwaltung von VMware-Software (ESXi, vCenter, PSC und NSX) in privaten Clouds verantwortlich.

Zu den Softwareupdates gehören:

  • Patches:von VMware veröffentlichte Sicherheitspatches oder Fehlerkorrekturen
  • Updates: geringfügige Versionsänderung einer VMware-Stack-Komponente
  • Upgrades: Hauptversion einer VMware-Stack-Komponente

Die VMware Engine testet kritische Sicherheitspatches, sobald sie bei VMware verfügbar sind. Gemäß dem SLA führt VMware Engine Sicherheitspatches innerhalb einer Woche nach ihrer Verfügbarkeit in privaten Cloud-Umgebungen ein.

Wenn eine neue Hauptversion der VMware-Software verfügbar ist, koordiniert VMware Engine gemeinsam mit den Kunden ein geeignetes Wartungsfenster für die Anwendung des Upgrades. VMware Engine wendet Upgrades der Hauptversion mindestens sechs Monate nach Veröffentlichung der Hauptversion an und benachrichtigt Kunden einen Monat vor der Durchführung eines Hauptversionsupgrades.

VMware Engine arbeitet auch mit wichtigen Branchenanbietern zusammen, um sicherzustellen, dass sie die neueste VMware-Softwareversion unterstützen, bevor ein Hauptversionsupgrade eingeführt wird. Informationen zum Support für bestimmte Anbieter erhalten Sie von Cloud Customer Care.

Vorbereitung

Google empfiehlt die folgenden Vorbereitungen, bevor Sie ein Update oder Upgrade starten:

  • Speicherkapazität prüfen: Achten Sie darauf, dass die Speicherauslastung Ihres vSphere-Clusters unter 80% liegt, um das SLA aufrechtzuerhalten. Wenn die Auslastung über 80 % liegt, können Upgrades länger als normal dauern oder komplett fehlschlagen. Wenn die Speicherauslastung über 70 % liegt, fügen Sie einen Knoten hinzu, um den Cluster zu erweitern und mögliche Ausfallzeiten während Upgrades zu vermeiden.
  • vSAN-Speicherrichtlinien mit FTT von 0 ändern:Ändern Sie VMs, die mit einer vSAN-Speicherrichtlinie für Failures to Tolerate (FTT) von 0 konfiguriert sind, in eine vSAN-Speicherrichtlinie mit FTT von 1, um das SLA aufrechtzuerhalten.
  • VM-CD-Bereitstellungen entfernen:Entfernen Sie alle CDs, die auf Ihren Arbeitslast-VMs bereitgestellt sind und nicht mit vMotion kompatibel sind.
  • Installation von VMware-Tools abschließen: Schließen Sie alle Installationen oder Upgrades der VMware-Tools ab, bevor das geplante Upgrade beginnt.
  • SCSI-Bus-Freigabe auf VMs entfernen: Entfernen Sie die SCSI-Bus-Freigabe auf VMs, wenn die VMs nicht deaktiviert werden sollen.
  • Nicht zugängliche VMs und Datenspeicher entfernen: Entfernen Sie verwaiste und nicht zugängliche VMs aus dem vCenter-Inventar. Entfernen Sie alle nicht zugänglichen externen Datenspeicher.
  • DRS-Regeln deaktivieren: DRS-Regeln, die eine VM an einen Host anheften, verhindern, dass ein Knoten in den Wartungsmodus wechselt. Sie können die DRS-Regeln vor dem Upgrade deaktivieren und nach Abschluss des Upgrades wieder aktivieren.
  • VM-Add-ons und Drittanbieterlösungen aktualisieren: Prüfen Sie, ob VMware-Add-ons und Drittanbieterlösungen, die auf dem vCenter Ihrer privaten Cloud bereitgestellt werden, mit den zuvor genannten Versionen nach dem Upgrade kompatibel sind. Beispiele für Tools sind Tools für Sicherung, Monitoring, Orchestrierung der Notfallwiederherstellung und andere ähnliche Funktionen. Wenden Sie sich an den Lösungsanbieter und aktualisieren Sie sie gegebenenfalls im Voraus, um die Kompatibilität nach dem Upgrade sicherzustellen.

Konfigurationen, die sich auf Wartungsprozesse auswirken können

Die VMware Engine nutzt den Wartungsmodus von VMware für Upgrades, Updates und Knotenwartungen. Dies trägt dazu bei, den unterbrechungsfreien Betrieb Ihrer Private Cloud-Arbeitslasten sicherzustellen. Für die folgenden Konfigurationen sind jedoch möglicherweise zusätzliche Schritte erforderlich, bevor ein Knoten in den Wartungsmodus wechseln kann:

  • DRS-Regeln:MÜSSEN Regeln festlegen, die erzwingen, dass VMs auf einem bestimmten Knoten bleiben.
  • SCSI-Busfreigabe: VMs, die für die gemeinsame Nutzung von SCSI-Bussen konfiguriert sind.
  • CD-ROM-Bereitstellungen: VMs mit angehängten CD-ROMs, insbesondere wenn diese CD-ROMs nicht mit vMotion auf einen anderen Knoten verschoben werden können.
  • Verbindungen serieller Ports:VMs mit Verbindungen serieller Ports, die verhindern, dass sie mit vMotion auf einen anderen Knoten verschoben werden.
  • Rohgerätezuordnungen (RDM): VMs, die direkt auf physische Speichergeräte zugreifen.

Wenn Maßnahmen erforderlich sind

Wenn eine dieser Konfigurationen auf einem Knoten vorhanden ist, werden Sie von Cloud Customer Care mindestens 24 Stunden vor der Durchführung der Abhilfemaßnahmen benachrichtigt, die zur Aufrechterhaltung der Verfügbarkeit Ihrer Private Cloud erforderlich sind. In einigen Fällen kann Ihre Arbeitslast durch Schritte wie das Ausschalten einer VM, das Verschieben mit vMotion und das anschließende Einschalten oder das Entfernen von CD-ROMs kurzzeitig unterbrochen werden.

Nächste Schritte