Sie können auswählen, wie die Instanzen Ihrer virtuellen Maschinen (VMs) während oder nach einem Hostereignis reagieren, indem Sie die Hostwartungsrichtlinie festlegen. Ein Hostereignis kann die reguläre Wartung der Compute Engine-Infrastruktur oder einen Hostfehler auf einer VM umfassen. Standardmäßig sind VMs bei Hostsystemereignissen auf Live-Migration eingestellt. Sie können sie jedoch so einstellen, dass sie beendet und optional neu gestartet werden.
Hostereignisse
Die folgenden Hostereignisse führen je nach den festgelegten Hostwartungsrichtlinien entweder zur Live-Migration oder zur Beendigung der VM:
Wartungsereignisse
Ein Wartungsereignis ist ein Zeitpunkt, zu dem Compute Engine eine VM beendet, um eine Hardware- oder Softwareaktualisierung durchzuführen. Wenn Sie die Hostwartungsrichtlinie für Live-Migration aktivieren, verschiebt Compute Engine die VM auf einen neuen Host und es kommt zu keiner Unterbrechung Ihrer Anwendung.
Das VM-Verhalten während eines Wartungsereignisses kann je nach Mandantenfähigkeit der VM variieren. Die folgende Tabelle zeigt einige Unterschiede zwischen dem Verhalten von Mehrmandanten- und VMs für einzelne Mandanten während Wartungsereignissen.
Host-Mandantenfähigkeit | Ungefähre Häufigkeit* | Live-Migration zum neuen Host | Hostauswahl |
---|---|---|---|
Mandantenfähig | Alle 2 Wochen | Ja | Compute Engine |
Einzelner Mandant | Alle 4 bis 6 Wochen | Abhängig von der Hostwartungsrichtlinie | Hängt von der Hostwartungsrichtlinie ab |
Compute Engine wendet auch einfache Hypervisor- und Netzwerkupgrades im Hintergrund unterbrechungsfrei an.
Hostfehler
Ein Hostfehler (compute.instances.hostError
) bedeutet, dass auf der physischen Maschine, die Ihre VM hostet, ein Problem mit der Hardware oder Software aufgetreten ist, das zum Absturz der VM führte. Ein Hostfehler, der einen völligen Hardwareausfall oder andere Hardwareprobleme nach sich zieht, kann eine Live-Migration Ihrer VM verhindern. Wenn Ihre VM so eingestellt ist, dass sie automatisch neu startet (dies ist die Standardeinstellung), startet Google Ihre VM in der Regel innerhalb von drei Minuten ab dem Fehler. Je nach Problem kann der Neustart bis zu 5,5 Minuten dauern.
Bestimmte Ressourcen verhalten sich anders, z. B. lokale SSDs. Wenn ein Hostfehler auftritt, versucht Compute Engine, die Verbindung zur VM wiederherzustellen und die lokalen SSD-Daten beizubehalten. Wenn die zugrunde liegende Festplatte jedoch nicht innerhalb von 60 Minuten wiederhergestellt wird, wird die VM ohne die lokalen SSD-Daten neu gestartet. Während Compute Engine Ihre VM und die lokale SSD wiederhergestellt, was bis zu 60 Minuten dauern kann, reagieren das Hostsystem und das zugrunde liegende Laufwerk nicht mehr. Weitere Informationen zum Verhalten lokaler SSD-Laufwerke bei Hostfehlern finden Sie unter Persistenz lokaler SSD-Daten.
Wenn Hardware vollständig ausfällt oder anderweitig die Live-Migration verhindert, stürzt die VM ab und startet automatisch wieder neu. Dabei wird ein Hostfehler protokolliert.
Manchmal reagiert eine VM möglicherweise nicht mehr, bevor ein Hostfehler erkannt wird. Sie können die Zeit verkürzen, die Compute Engine auf den Neustart oder die Beendigung der VM wartet. Verwenden Sie dazu das Flag --host-error-timeout-seconds
(Vorschau). Dieses Flag legt fest, wie lange Compute Engine maximal wartet, bis eine VM neu gestartet oder beendet wird, nachdem erkannt wurde, dass die VM nicht mehr reagiert.
Weitere Informationen finden Sie unter Verfügbarkeitsrichtlinien festlegen.
Physische Hardware- und Softwarefehler können von Zeit zu Zeit auftreten, sind jedoch eher selten. Um Ihre Anwendungen und Dienste solchen potenziell störenden Systemereignissen zu schützen, sollten Sie folgende Ressourcen prüfen:
- Robuste Systeme konzipieren
- Skalierbare und robuste Anwendungen erstellen
- Verwaltete Instanzgruppen erstellen
Google bietet auch verwaltete Dienste wie App Engine und die flexible App Engine-Umgebung.
Hostwartungsrichtlinie
Die Hostwartungsrichtlinie einer VM bestimmt, wie sie sich bei den folgenden Ereignissen verhält:
- Bei einem Wartungsereignis, bei dem Google eine VM auf einen anderen Hostcomputer verschieben muss
- Bei einem Hostfehler, bei dem Google eine VM beenden oder neu starten muss
Sie können VMs so konfigurieren, dass sie während der Hostwartung weiterhin ausgeführt werden, während sie von Compute Engine live zu einem anderen Host migriert werden, oder Sie können stattdessen Ihre VMs beenden. Die Hostwartungsrichtlinie einer VM kann jederzeit aktualisiert werden, um zu steuern, wie sich Ihre VMs verhalten sollen.
Sie können die Hostwartungsrichtlinie einer VM ändern. Dazu konfigurieren Sie die folgenden Einstellungen:
- Wartungsverhalten: Gibt an, ob die VM live migriert oder beendet wird, wenn ein Wartungsereignis auftritt.
- Neuverhalten: Gibt an, ob Compute Engine die VM neu startet oder beendet, wenn die VM abstürzt oder ein Hostfehler auftritt.
- Erkennungszeit für Hostfehler: Die maximale Zeit, die Compute Engine auf den Neustart oder die Beendigung einer VM wartet, nachdem erkannt wurde, dass die VM nicht mehr reagiert.
Standardmäßig wird für VMs bei der Wartung eine Live-Migration ausgeführt. Sie können dieses Verhalten ändern und Ihre VM bei Wartungsereignissen stattdessen beenden.
Live-Migration
Standardmäßig ist für Standard-VMs die Live-Migration festgelegt. Dabei wird die VM bei einem Wartungsereignis der Infrastruktur von Compute Engine automatisch an eine andere Stelle migriert. Die VM kann so während der Migration weiterhin ausgeführt werden. Auf der VM wird möglicherweise ein vorübergehender Leistungsabfall verzeichnet, aber im Allgemeinen sollten die meisten VMs keine nennenswerten Unterschiede aufweisen. Dies ist ideal für VMs, die eine konstante Betriebszeit erfordern und eine kurzfristig verminderte Leistung tolerieren.
Mit der Migration Ihrer VM von Compute Engine wird ein Systemereignis gemeldet und in der Liste der Zonenvorgänge angezeigt. Sie können dieses Ereignis durch Aufruf der Compute Engine-Vorgänge für eine bestimmte Zone prüfen. Für Live-Migrationsereignisse gilt folgender Vorgangstyp:
compute.instances.migrateOnHostMaintenance
Beenden und (optional) neu starten
Wenn für Ihre VM keine Live-Migration ausgeführt werden soll, können Sie Ihre VM auch beenden und wahlweise neu starten. Wenn VMs so eingestellt werden, dass sie beendet und optional neu gestartet werden, sendet Compute Engine ein "Soft-Power-Off"-Signal zum Herunterfahren der VM. Anschließend wird 60 Sekunden gewartet, bis die VM ordnungsgemäß heruntergefahren ist, die VM wird beendet und in zeitlichem Abstand zum Wartungsereignis neu gestartet. Wenn die VM nicht innerhalb von 60 Sekunden ordnungsgemäß heruntergefahren wurde, wird sie beendet.
Diese Option ist ideal, wenn Ihre VMs eine konstante, maximale Leistung benötigen und die gesamte Anwendung auf die Bewältigung von VM-Fehlern oder Neustarts ausgelegt ist.
Wenn Ihre VMs in Compute Engine beendet und neu gestartet werden, wird ein Systemereignis gemeldet, das in der Liste der Zonenvorgänge angezeigt wird. Sie können dieses Ereignis durch Aufrufen der Compute Engine-Vorgänge für eine bestimmte Zone überprüfen. Für beendete Ereignisse gilt folgender Vorgangstyp:
compute.instances.terminateOnHostMaintenance
Beim Neustart der VM wird das gleiche nichtflüchtige Bootlaufwerk verwendet und alle konfigurierten sekundären, nichtflüchtigen Speicher werden wieder angehängt. Die Daten auf diesen Laufwerken bleiben über die Migration und den Neustart der VM hinweg erhalten.
Lokale SSD-Daten gehen verloren, wenn eine VM beendet wird. Beim Neustart der VM wird ein neues lokales SSD erstellt, das Sie formatieren und bereitstellen müssen.
Automatischer Neustart
Wenn Ihre VM so eingestellt ist, dass sie bei Wartungsarbeiten beendet wird, oder Ihre VM wegen eines zugrundeliegenden Hardwarefehlers abstürzt, können Sie Google Compute Engine so einstellen, dass die VM automatisch neu startet. Setzen Sie dazu das Feld automaticRestart
auf true
. Diese Einstellung gilt nicht, wenn die VM durch eine Nutzeraktion offline genommen wurde, zum Beispiel durch das Aufrufen von sudo shutdown
, oder während eines Zonenausfalls.
Beim automatischen Neustart der VM in Compute Engine wird ein Systemereignis gemeldet, das in der Liste der Zonenvorgänge angezeigt wird. Sie können dieses Ereignis durch Aufrufen der Compute Engine-Vorgänge für eine bestimmte Zone überprüfen. Für automatische Neustartereignisse gilt folgender Vorgangstyp:
compute.instances.automaticRestart
Nächste Schritte
- Live-Migration
- VM-Hostwartungsrichtlinie festlegen
- Live-Migrationshinweise abrufen
- Hostwartung simulieren
- GPU-Hostwartungsereignisse
- Live-Migration von VMs für einzelne Mandanten manuell ausführen