Wartung und Aktualisierungen der privaten Cloud

Private Cloud-Umgebungen sind so konzipiert, dass sie keinen Single Point of Failure haben:

  • ESXi-Cluster sind mit vSphere HA (Hochverfügbarkeit) konfiguriert. Die Cluster haben eine Größe, die zur Gewährleistung der Ausfallsicherheit mindestens einen freien Knoten bietet.
  • vSAN bietet redundanten primären Speicher, wobei mindestens drei Knoten erforderlich sind, um Schutz vor einem einzelnen Ausfall zu bieten. Bei größeren Clustern können Sie vSAN so konfigurieren, dass eine höhere Stabilität ermöglicht wird.
  • Virtuelle Maschinen (vCenter, PSC und NSX Manager) werden mit RAID-10-Speicher konfiguriert, um Speicherfehler zu verhindern. Die VMs werden zusätzlich durch vSphere HA vor Knoten- und Netzwerkausfällen geschützt.
  • ESXi-Hosts haben redundante Lüfter und NICs.
  • TOR- und Spine-Switches sind in HA-Paaren konfiguriert, um für Ausfallsicherheit zu sorgen.

VMware Engine überwacht kontinuierlich die Verfügbarkeit, überwacht die Verfügbarkeit und stellt SLAs zur Verfügbarkeit für die folgenden Arten von VMs bereit:

  • ESXi-Hosts
  • vCenter
  • PSC
  • NSX Manager

VMware Engine überwacht kontinuierlich Folgendes auf Ausfälle:

  • Festplatten
  • Ports der physischen Netzwerkkarte
  • Server
  • Lüfter
  • Stromversorgung
  • Schalter
  • Switch-Ports

Wenn ein Laufwerk oder ein Knoten ausfällt, fügt VMware Engine sofort einen entsprechenden Knoten zum betroffenen VMware-Cluster hinzu, um den Dienst wiederherzustellen.

Die folgenden VMware-Elemente in den privaten Clouds werden gesichert, verwaltet und aktualisiert:

  • ESXi
  • vCenter Platform Services Controller
  • vSAN
  • NSX

Sichern und wiederherstellen

Sicherungen umfassen Folgendes:

  • Nächtliche inkrementelle Sicherungen von vCenter-, PSC- und DVS-Regeln
  • Native vCenter-APIs zum Sichern von Komponenten auf Anwendungsebene
  • Automatische Sicherung vor der Aktualisierung oder vor Upgrades der VMware-Verwaltungssoftware

Wartung

Es gibt folgende Arten von geplanten Wartungsarbeiten:

Back-End und interne Wartung

Das Back-End und die interne Wartung umfassen in der Regel die Neukonfiguration physischer Assets oder die Installation von Software-Patches. Das hat keinen Einfluss auf die normale Nutzung der gewarteten Assets. Bei redundanten NICs zu jedem physischen Rack sind der normale Netzwerktraffic und die privaten Cloud-Vorgänge nicht betroffen. Die Leistung wird möglicherweise nur beeinträchtigt, wenn Ihre Organisation im Wartungszeitraum die volle redundante Bandbreite nutzen will.

Portalwartung

Wenn die Steuerungsebene oder Infrastruktur aktualisiert wird, ist eine Dienstausfallzeit für eine begrenzte Zeit unvermeidlich. Die Wartungen können einmal pro Monat erfolgen und werden voraussichtlich im Laufe der Zeit abnehmen. VMware Engine informiert Sie über bevorstehende Portalwartungen und versucht, das Wartungsintervall so kurz wie möglich zu halten. Während einer Portalwartung funktionieren die folgenden Dienste weiter ohne Beeinträchtigung:

  • VMware-Verwaltungsebene und -Anwendungen
  • vCenter-Zugriff
  • Alle Netzwerke und Speicher

VMware-Infrastruktur warten

Gelegentlich müssen Änderungen an der Konfiguration der VMware-Infrastruktur vorgenommen werden. Diese Intervalle können alle ein bis zwei Monate stattfinden, aber es ist zu erwarten, dass die Häufigkeit mit der Zeit abnimmt. Diese Art der Wartung kann in der Regel durchgeführt werden, ohne die normale Nutzung der privaten Cloud zu unterbrechen. Während eines VMware-Wartungsintervalls funktionieren die folgenden Dienste weiter ohne Beeinträchtigung:

  • VMware-Verwaltungsebene und -Anwendungen
  • vCenter-Zugriff
  • Alle Netzwerke und Speicher

Aktualisierungen und Upgrades

VMware Engine ist für die Lebenszyklusverwaltung von VMware-Software (ESXi, vCenter, PSC und NSX) in privaten Clouds verantwortlich.

Zu den Softwareupdates gehören:

  • Patches:von VMware veröffentlichte Sicherheitspatches oder Fehlerkorrekturen
  • Updates: geringfügige Versionsänderung einer VMware-Stack-Komponente
  • Upgrades: Hauptversion einer VMware-Stack-Komponente

VMware Engine testet kritische Sicherheitspatches, sobald sie von VMware verfügbar sind. Gemäß dem SLA zielt die VMware Engine auf ein Roll-out von Sicherheitspatches in privaten Cloud-Umgebungen ab, die innerhalb einer Woche nach deren Verfügbarkeit erfolgen.

Wenn eine neue Hauptversion der VMware-Software verfügbar ist, koordiniert VMware Engine gemeinsam mit den Kunden ein geeignetes Wartungsfenster für die Anwendung des Upgrades. VMware Engine wendet Hauptversionsupgrades mindestens sechs Monate nach Veröffentlichung der Hauptversion an und benachrichtigt Kunden einen Monat vor der Anwendung von Hauptversionsupgrades.

VMware Engine arbeitet außerdem mit wichtigen Branchenanbietern zusammen, um sicherzustellen, dass diese die neueste VMware-Softwareversion unterstützen, bevor ein größeres Versionsupgrade eingeführt wird. Informationen zum Support für bestimmte Anbieter erhalten Sie von Cloud Customer Care.

Vorbereitung

Google empfiehlt, die folgenden Vorbereitungen zu treffen, bevor Sie mit einem Update oder Upgrade beginnen:

  • Speicherkapazität prüfen: Achten Sie darauf, dass die Speichernutzung des vSphere-Clusters unter 80% liegt, um das SLA einzuhalten. Bei einer Auslastung von mehr als 80 % können Upgrades länger als normal dauern oder vollständig fehlschlagen. Wenn die Speicherauslastung über 70 % liegt, fügen Sie einen Knoten hinzu, um den Cluster zu erweitern und potenzielle Ausfallzeiten bei Upgrades zu vermeiden.
  • vSAN-Speicherrichtlinien mit FTT von 0 ändern:Ändern Sie VMs, die mit einer vSAN-Speicherrichtlinie für Fehler bei Tolerate (FTT) von 0 konfiguriert sind, in eine vSAN-Speicherrichtlinie mit FTT von 1, um das SLA beizubehalten.
  • VM-CD-Bereitstellungen entfernen:Entfernen Sie alle CDs, die auf Ihren Arbeitslast-VMs bereitgestellt sind, die nicht mit vMotion kompatibel sind.
  • VMware-Tool-Installationen abschließen: Führen Sie alle Installationen oder Upgrades der VMware-Tools vor Beginn des geplanten Upgrades durch.
  • SCSI-Bus-Freigabe auf VMs entfernen: Entfernen Sie die SCSI-Bus-Freigabe auf VMs, wenn die VMs nicht deaktiviert werden sollen.
  • Nicht zugängliche VMs und Datenspeicher entfernen: Entfernen Sie nicht verwendete und nicht zugängliche VMs aus dem vCenter-Inventar. Entfernen Sie alle nicht zugänglichen externen Datenspeicher.
  • DRS-Regeln (Distributed Resource Scheduler) deaktivieren: DRS-Regeln, die eine VM an einen Host anpinnen, verhindern, dass ein Knoten in den Wartungsmodus wechselt. Sie können die DRS-Regeln vor dem Upgrade deaktivieren und nach Abschluss des Upgrades aktivieren.
  • VMware-Add-ons und Drittanbieterlösungen aktualisieren:Prüfen Sie, ob VMware-Add-ons und Drittanbieterlösungen, die auf Ihrem vCenter der privaten Cloud bereitgestellt werden, mit den zuvor genannten Versionen nach dem Upgrade kompatibel sind. Beispiele für Tools sind Tools für Sicherung, Monitoring, Orchestrierung der Notfallwiederherstellung und andere ähnliche Funktionen. Wenden Sie sich an den Lösungsanbieter und aktualisieren Sie sie bei Bedarf rechtzeitig, um die Kompatibilität nach dem Upgrade sicherzustellen.

Konfigurationen, die sich auf Wartungsprozesse auswirken können

VMware Engine nutzt den Wartungsmodus von VMware, um Upgrades, Updates und Knotenwartungen durchzuführen. Dies gewährleistet den unterbrechungsfreien Betrieb Ihrer Private Cloud-Arbeitslasten. Die folgenden Konfigurationen können jedoch zusätzliche Schritte erfordern, bevor ein Knoten in den Wartungsmodus wechseln kann:

  • DRS-Regeln: MÜSSEN Regeln, die VMs erzwingen, um auf einem bestimmten Knoten zu bleiben.
  • SCSI-Bus-Freigabe: VMs, die für die gemeinsame Nutzung von SCSI-Bussen konfiguriert sind.
  • CD-ROM-Bereitstellungen: VMs mit angehängten CD-ROMs, insbesondere wenn diese CD-ROMs nicht mit vMotion auf einen anderen Knoten verschoben werden können.
  • Verbindungen mit seriellen Ports:VMs, die Verbindungen mit seriellen Ports verwenden, die verhindern, dass sie mit vMotion auf einen anderen Knoten verschoben werden können.
  • Raw Device Mappings (RDM): VMs, die direkt auf physische Speichergeräte zugreifen.

Wenn Maßnahmen erforderlich sind

Wenn eine dieser Konfigurationen auf einem Knoten vorhanden ist, benachrichtigt Cloud Customer Care mindestens 24 Stunden, bevor Sie die erforderlichen Schritte zur Aufrechterhaltung der Verfügbarkeit Ihrer Private Cloud ausführen. In einigen Fällen kann Ihre Arbeitslast durch Schritte wie das Ausschalten einer VM, das Verschieben mit vMotion und das anschließende Einschalten oder das Entfernen von CD-ROMs kurzzeitig unterbrochen werden.

Nächste Schritte