GPU-Hostereignisse verarbeiten


VMs mit angehängten GPUs können nicht live migriert werden. Sie müssen die Einstellungen so vornehmen, dass diese VMs für Hostereignisse beendet werden. Bei Bedarf können Sie die beendeten VMs so einstellen, dass sie nach einer Hostwartung automatisch neu gestartet werden. Hostwartungen werden in Compute Engine einmal alle zwei Wochen, möglicherweise aber öfter ausgeführt.

Um Unterbrechungen der Arbeitslasten während eines Wartungsereignisses zu minimieren, können Sie ein Monitoring des Wartungsplans für Ihre VM-Instanz durchführen und die Arbeitslasten auf den Übergang beim Neustart des Systems vorbereiten.

Um im Voraus eine Warnung über Hostereignisse zu erhalten, führen Sie ein Monitoring des Metadatenwerts /computeMetadata/v1/instance/maintenance-event durch. Wenn die Anfrage an den Metadatenserver NONE zurückgibt, ist die Beendigung der VM nicht geplant. Führen Sie in einer VM beispielsweise den folgenden Befehl aus:

curl http://metadata.google.internal/computeMetadata/v1/instance/maintenance-event -H "Metadata-Flavor: Google"

NONE

Wenn der Metadatenserver TERMINATE_ON_HOST_MAINTENANCE zurückgibt, ist die Beendigung Ihrer VM geplant. Compute Engine sendet den GPU-VMs eine Stunde vorher eine Warnung, während normale VMs nur 60 Sekunden im Voraus gewarnt werden. Konfigurieren Sie Ihre Anwendung für die Umstellung durch das Wartungsereignis. Beispielsweise können Sie eine der folgenden Methoden verwenden:

  • Konfigurieren Sie Ihre Anwendung so, dass laufende Arbeiten vorübergehend in einen Cloud Storage-Bucket verschoben werden. Rufen Sie diese Daten dann nach dem Neustart der VM ab.

  • Schreiben Sie Daten in einen sekundären nichtflüchtigen Speicher. Nachdem die VM automatisch neu gestartet wurde, kann der nichtflüchtige Speicher wieder angehängt werden und Ihre Anwendung setzt die Arbeit fort.

Nächste Schritte