VM-Instanzen auf Abruf

Auf dieser Seite werden VM-Instanzen auf Abruf erläutert. Wie Sie eine Instanz auf Abruf erstellen, erfahren Sie unter VMs auf Abruf erstellen und verwenden. Weitere Informationen zu Instanzen im Allgemeinen finden Sie in der Dokumentation zu VM-Instanzen.

Was ist eine Instanz auf Abruf?

VM-Instanzen auf Abruf haben einen wesentlich niedrigeren Preis (60–91% Rabatt) im Vergleich zum Preis von Standard-VMs. Compute Engine kann diese Instanzen jedoch beenden (Abruf), wenn die Rechenkapazität für die Zuordnung zu anderen VMs zurückgefordert werden muss. Instanzen auf Abruf nutzen überschüssige Compute Engine-Kapazitäten, deren Verfügbarkeit je nach Nutzung variiert.

Wenn Ihre Anwendungen fehlertolerant sind und mit möglichen Instanzunterbrechungen zurechtkommen, können Sie mit Instanzen auf Abruf Ihre Compute Engine-Kosten erheblich reduzieren. Sie können beispielsweise Batchjobs mit Instanzen auf Abruf ausführen. Wenn einige dieser Instanzen während der Verarbeitung beendet werden, verlangsamt sich der Job zwar, stoppt aber nicht vollständig. Instanzen auf Abruf schließen Ihre Batchverarbeitungsaufgaben ab, ohne Ihre vorhandenen Instanzen zusätzlich zu belasten, und Sie müssen nicht den vollen Preis für zusätzliche normale Instanzen bezahlen.

Einschränkungen von präemptiven Instanzen

Instanzen auf Abruf funktionieren wie normale Instanzen, haben aber die folgenden Einschränkungen:

Compute Engine kann Instanzen auf Abruf jederzeit aufgrund von Systemereignissen beenden. Die Wahrscheinlichkeit, dass Compute Engine eine Instanz auf Abruf wegen eines Systemereignisses stoppt, ist in der Regel gering, kann aber von Tag zu Tag und Zone zu Zone abhängig von den aktuellen Bedingungen variieren.
Compute Engine beendet Instanzen auf Abruf immer, wenn sie 24 Stunden lang ausgeführt wurden. Bestimmte Aktionen setzen diese 24-Stunden-Frist zurück.
Instanzen auf Abruf sind begrenzte Compute Engine-Ressourcen, die unter Umständen nicht immer verfügbar sind.
Für Instanzen auf Abruf kann keine Live-Migration zu einer regulären VM-Instanz durchgeführt werden. Sie können auch nicht so eingestellt werden, dass sie bei einem Wartungsereignis automatisch neu starten.
Aufgrund der oben genannten Einschränkungen sind Instanzen auf Abruf nicht von Service Level Agreements (SLAs) abgedeckt und vom Compute Engine-SLA ausgeschlossen.
Das Guthaben der kostenlosen Stufe von Google Cloud für Compute Engine gilt nicht für Instanzen auf Abruf.

Vorzeitiges Beenden von VMs auf Abruf

In diesem Abschnitt wird beschrieben, wie VMs auf Abruf von Compute Engine vorzeitig beendet und welche VMs für das vorzeitige Beenden ausgewählt werden.

Präemptionsprozess

Compute Engine führt zur vorzeitigen Beendigung einer Instanz folgende Schritte aus:

Compute Engine sendet eine Benachrichtigung über die vorzeitige Beendigung an die Instanz in Form des Signals ACPI G2 Soft Off. Sie können zur Verarbeitung der Benachrichtigung ein Shutdown-Skript verwenden und Bereinigungsaktionen ausführen, bevor die Instanz beendet wird.
Wenn die Instanz nach 30 Sekunden nicht beendet ist, sendet Compute Engine das Signal ACPI G3 Mechanical Off an das Betriebssystem.
Compute Engine versetzt die Instanz in den Status TERMINATED.

Sie können eine Instanzpräemption simulieren, indem Sie die Instanz beenden.

Präemptiv beendete Instanzen erscheinen noch in Ihrem Projekt, werden aber nicht pro Stunde abgerechnet, während sie sich im Status TERMINATED befinden. Sie können auf die Daten eines jeden nichtflüchtigen Speichers, der mit der Instanz verbunden ist, zugreifen und diese wiederherstellen. Allerdings entstehen weiterhin Speicherkosten, bis Sie den Speicher löschen. Wie bei normalen Instanzen wird nichtflüchtiger Speicher, der zum automatischen Löschen markiert wurde, beim Löschen der Instanz auf Abruf gelöscht. Sie können eine vorzeitig beendete Instanz beliebig oft neu starten, solange Kapazität vorhanden ist. Der Neustart einer Instanz auf Abruf setzt den Prozess der vorzeitigen Beendigung zurück.

Wenn Compute Engine eine Instanz auf Abruf weniger als eine Minute nach ihrer Erstellung beendet, wird Ihnen die Verwendung dieser VM-Instanz nicht in Rechnung gestellt. So zahlen Sie nur dann für Instanzen auf Abruf, wenn sie auch genügend Zeit hatten, um ein signifikantes Arbeitsvolumen zu erledigen. Allerdings werden die Kosten für Premium-Betriebssysteme wie immer berechnet.

Präemptionsauswahl

In unseren Best Practices finden Sie Vorschläge zur Reduzierung der vorzeitigen Beendigungsrate. Beachten Sie, dass Compute Engine Ihnen keine Kosten für Instanzen berechnet, wenn diese in der ersten Minute nach Beginn ihrer Ausführung vorzeitig beendet werden.

Durch bestimmte Aktionen wird die 24-Stunden-Frist für Instanzen auf Abruf zurückgesetzt. Wenn Sie eine Instanz stoppen und neu starten, setzt Compute Engine die Frist zurück, da die Instanz in den Status TERMINATED versetzt wird. Andere Aktionen, bei denen die Instanz weiterhin den Status RUNNING hat, führen jedoch nicht zu einer Zurücksetzung der Frist. Dazu zählen beispielsweise das Zurücksetzen einer Instanz oder das Ausführen eines sudo reboot innerhalb der VM.

Preise

VMs auf Abruf verwenden Spot-Preise, dasselbe Preismodell wie Spot-VMs. Weitere Informationen zu den Preisen für VMs auf Abruf finden Sie unter Preise für Spot-VMs. Die aktuellen Preise finden Sie auf den Preisseiten für Compute Engine.

VMs auf Abruf mit Compute Engine verwenden

Dieser Abschnitt enthält wichtige Informationen zur Verwendung von VMs auf Abruf mit anderen Compute Engine-Angeboten. Erfahren Sie mehr über die Verwendung von VMs auf Abruf mit verwalteten Instanzgruppen, Premium-Betriebssystemen, lokalen SSDs und GPUs. Außerdem erfahren Sie, wie sich VMs auf Abruf auf Ihre Kontingente für Compute Engine-Ressourcen auswirken.

Instanzen auf Abruf in einer verwalteten Instanzgruppe

Sie können präemptive Instanzen in einer verwalteten Instanzgruppe erstellen. Geben Sie dafür die Option für Instanzen auf Abruf in der Instanzvorlage an, bevor Sie die Gruppe erstellen oder aktualisieren.

Verwaltete Instanzgruppen können neue präemptive Instanzen nur dann erstellen oder hinzufügen, wenn zusätzliche Compute Engine-Ressourcen zur Verfügung stehen. Wenn diese Ressourcen begrenzt sind, können verwaltete Instanzgruppen die Anzahl der präemptiven Instanzen in der Gruppe weder ändern noch automatisch skalieren.

Verwaltete Instanzgruppen versuchen immer, ihre Zielgröße oder die vom Autoscaling für diese Gruppe vorgegebene Größe beizubehalten. Wenn Compute Engine eine Instanz auf Abruf in einer verwalteten Instanzgruppe beendet, versucht die Gruppe wiederholt, diese Instanz mithilfe der angegebenen Instanzvorlage neu zu erstellen. Wenn die erforderlichen Ressourcen wieder verfügbar sind, erstellt die Gruppe die Instanz neu und erhält die Zielgruppengröße aufrecht.

Premium-Betriebssysteme auf Instanzen auf Abruf

Instanzen auf Abruf reduzieren nicht die Kosten von Premium-Betriebssystemen und ändern nicht die Art und Weise, wie Ihnen die Nutzung dieser Betriebssysteme in Rechnung gestellt wird. Wenn Compute Engine eine Instanz auf Abruf beendet, auf der ein Premium-Betriebssystem ausgeführt wird, zahlen Sie so für dieses Betriebssystem, als ob Sie die Instanz selbst beendet hätten. Die Mindestkosten für die Nutzung gelten weiterhin und die Rechnungen für Premium-Betriebssysteme werden immer noch durch Aufrundung auf das nächste Nutzungsinkrement berechnet.

Für die Maschinentypen der Instanzen auf Abruf, auf denen Premium-Betriebssysteme ausgeführt werden, erfolgt die Abrechnung immer pro Sekunde und entsprechend den Preisen auf der Seite Maschinentyp – Preise.

Lokale SSDs auf Instanzen auf Abruf

Wenn Sie eine Spot-VM oder eine VM auf Abruf mit einem lokalen SSD-Laufwerk starten, berechnet Compute Engine einen Rabatt für die Spot-Preise für die Nutzung der lokalen SSD. Lokale SSD-Laufwerke, die mit Spot-VMs oder VMs auf Abruf verknüpft sind, funktionieren wie normale lokale SSD-Laufwerke. Sie haben die gleichen Datenpersistenz-Merkmale und bleiben angehängt, solange die VM besteht.

In Compute Engine werden lokale SSD-Laufwerke auf einer Spot-VM oder einer VM auf Abruf nicht berechnet, wenn die VM innerhalb einer Minute nach Beginn der Ausführung vorzeitig beendet wird.

GPUs auf präemptiven Instanzen

Sie können für VM-Instanzen auf Abruf GPUs hinzufügen oder entfernen und dabei von niedrigeren Preisen für GPUs auf Abruf profitieren. Zu präemptiven Instanzen hinzugefügte GPUs funktionieren wie normale GPUs, bleiben jedoch nur für die Lebensdauer der Instanz bestehen. Für Instanzen auf Abruf mit GPUs gilt derselbe Prozess für vorzeitiges Beenden wie für alle Instanzen auf Abruf.

Fordern Sie ein dediziertes Preemptible GPU-Kontingent an, das für GPUs auf Instanzen auf Abruf verwendet werden soll. Weitere Informationen finden Sie unter Kontingente für VM-Instanzen auf Abruf.

Bei Wartungsereignissen werden präemptive Instanzen mit GPUs standardmäßig beendet und können nicht automatisch neu gestartet werden. Wenn Sie die Instanzen neu erstellen möchten, nachdem sie beendet wurden, verwenden Sie eine verwaltete Instanzgruppe. Verwaltete Instanzgruppen erstellen Ihre Instanzen neu, sofern die vCPU-, Speicher- und GPU-Ressourcen verfügbar sind.

Wenn Sie eine Warnung erhalten möchten, bevor die Instanz vorzeitig beendet wird, oder die Instanz so konfigurieren möchten, dass sie nach einer Wartung automatisch neu gestartet wird, benutzen Sie eine Standardinstanz mit einer GPU. Für Standardinstanzen mit GPUs wird von Google eine Stunde vor der vorzeitigen Beendigung eine Warnung ausgegeben.

Compute Engine berechnet Ihnen keine GPUs, wenn ihre Instanzen in der ersten Minute nach dem Start der Ausführung wieder beendet werden.

Eine Anleitung zum automatischen Neustart einer Standardinstanz finden Sie unter Aktualisierungsoptionen für eine Instanz.

Informationen zum Erstellen von präemptiven Instanzen finden Sie unter VM mit angehängten GPUs erstellen.

Kontingente für VM-Instanzen auf Abruf

Wie andere VMs erfordern auch VMs auf Abruf verfügbare CPU-Kontingente. Wenn Sie VMs auf Abruf mit lokalen SSDs oder GPUs verwenden möchten, benötigen VMs auf Abruf außerdem entweder ein Laufwerkskontingent oder ein GPU-Kontingent.

Wenn Sie VMs auf Abruf mit diesen Ressourcen verwenden und kein Kontingent auf Abruf angefordert haben, verbrauchen VMs auf Abruf Ihr Standardkontingent für diese Ressourcen. Wenn Sie VMs auf Abruf verwenden möchten, sollten Sie ein Kontingent für diese Ressourcen anfordern, um zu verhindern, dass VMs auf Abruf Ihre Standardkontingente verbrauchen.

Nachdem Ihnen von Compute Engine ein Kontingent auf Abruf in einer Region zugeteilt wurde, werden alle VMs auf Abruf und alle Spot-VMs in dieser Region über dieses Kontingent angerechnet. Alle Standard-VMs in dieser Region werden weiterhin über das Standardkontingent angerechnet. In Regionen, in denen kein Kontingent auf Abruf vorhanden ist, können Sie das Standardkontingent verwenden, um VMs auf Abruf zu starten.

Das auf Abruf verfügbare Kontingent ist nicht auf den Kontingentseiten der gcloud CLI oder der Google Cloud Console sichtbar, es sei denn, Compute Engine hat das Kontingent zugeteilt.

Kontingent auf Abruf anfordern

Nächste Schritte

VMs auf Abruf erstellen und verwenden

Jetzt testen

Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Compute Engine in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Compute Engine kostenlos testen