Bereitstellungsmodelle bestimmen die Verfügbarkeit, Lebensdauer und Preise Ihrer Instanzen. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.
Verfügbare Bereitstellungsmodelle
Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.
Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen.
Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen.
Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen.
Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Instanzen jederzeit zu beenden oder zu löschen, um Kapazität zurückzugewinnen.
Nachdem Sie eine zonale verwaltete Instanzgruppe (MIG) erstellt haben, fordern Sie Compute Engine auf, der MIG Instanzen mit angehängten GPUs hinzuzufügen. Compute Engine plant die Bereitstellung der Instanzen basierend auf der Ressourcenverfügbarkeit.
Sie können festlegen, wann Instanzen gelöscht werden sollen. Sie können sie jedoch nicht stoppen, pausieren oder neu erstellen. Die Instanzen werden bis zu sieben Tage lang ausgeführt.
Anschließend werden sie von Compute Engine gelöscht.
Sie können eine Kapazitätsreservierung für ein zukünftiges Datum anfordern, um Instanzen mit angehängten GPUs zu erstellen. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie GPU-Instanzen erstellen, die der Reservierung entsprechen.
Während des genehmigten Reservierungszeitraums können Sie Instanzen beenden, neu starten, löschen und neu erstellen, um die Reservierung nach Bedarf zu nutzen.
Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen.
Anwendungsfälle
Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten:
Webserver
Datenbanken
Unternehmensanwendungen
Entwicklung und Tests
Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden Arbeitslasten:
Batchverarbeitung
Hochleistungs-Computing (HPC)
Continuous Integration und Continuous Deployment (CI/CD)
Datenanalyse
Medien-Codierung
Onlineinferenz
Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten:
Vortraining kleiner Modelle
Modellabstimmung
HPC-Simulation
Batch-Inferenz
Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.:
Für Arbeitslasten mit einer Dauer von bis zu 90 Tagen:
Jobs zum Vortrainieren von Modellen
Jobs zur Modellabstimmung
HPC-Simulationsarbeitslasten
Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast
Für Arbeitslasten, die länger als 90 Tage dauern:
Trainingsarbeitslasten
Inferenzarbeitslasten
Preise
Für Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen.
Die meisten vCPUs, GPUs und lokalen SSDs sind mit einem Rabatt von 60–91% verfügbar.
Weitere Informationen finden Sie unter Preise für Spot-VMs.
Je nach Maschinenfamilie, die von Ihren Instanzen verwendet wird, erhalten Sie bis zu 53% Rabatt auf vCPUs und GPUs. Weitere Informationen finden Sie unter Preise für Dynamic Workload Scheduler (DWS).
Je nach Maschinenfamilie, die von Ihren Instanzen verwendet wird, erhalten Sie bis zu 53% Rabatt auf vCPUs und GPUs. Außerdem fallen Kosten an, je nachdem, wie Sie Kapazität zum Erstellen von Instanzen reservieren:
Wenn die MIG der Gruppe Instanzen hinzufügt, wird das Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet.
Das Kontingent gilt nicht für das reservierungsgebundene Bereitstellungsmodell.
Verfügbarkeit und Lebensdauer von Instanzen
In der folgenden Tabelle sehen Sie die Verfügbarkeit und Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle:
Compute Engine stellt die angeforderte Kapazität zum ausgewählten Lieferdatum und zur ausgewählten Lieferzeit bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Instanzen erstellen.
Unterstützte Maschinenserien
Sie können jede Maschinenreihe außer A4X, A4 und A3 Ultra verwenden.
Sie können jede Maschinenserie verwenden, mit Ausnahme der folgenden:
M2 und M3
G4
Bare-Metal-Instanzen
Sie können nur die folgenden Maschinenserien verwenden:
Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.
Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.
Sie können Instanzen nur erstellen, indem Sie
Anfragen zur Größenanpassung in einer MIG erstellen. Compute Engine verwendet
DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.
Sie können Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am angeforderten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Instanzen erstellen können. Wenn Sie Ressourcen mit zukünftigen Reservierungen im Kalendermodus reservieren, verwendet Compute Engine
DWS, um die angeforderte Kapazität bereitzustellen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.
Lebensdauer von Instanzen
Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll. Die folgenden Fälle sind jedoch Ausnahmen:
Wenn der Maschinentyp, den die Instanz verwendet, keine Live-Migration unterstützt, werden Ihre Instanzen von Compute Engine während Hostwartungsereignissen beendet.
In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.
Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll. Die folgenden Fälle sind jedoch Ausnahmen:
Compute Engine kann die Instanz jederzeit beenden oder löschen, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet.
Wenn der Maschinentyp, den die Instanz verwendet, keine Live-Migration unterstützt, werden Ihre Instanzen von Compute Engine während Hostwartungsereignissen beendet.
In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.
Die bereitgestellten Instanzen werden für die von Ihnen ausgewählte Laufzeit ausgeführt, die bis zu sieben Tage betragen kann. Sie können Instanzen nicht beenden, anhalten oder neu erstellen.
Compute Engine löscht Instanzen, wenn einer der folgenden Fälle eintritt:
Sie fordern das Löschen von Instanzen an.
Die Instanzen erreichen das Ende ihrer Laufzeit.
Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll. Die folgenden Fälle sind jedoch Ausnahmen:
Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen.
In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.
Wenn Sie Kapazität reservieren möchten, um Instanzen mit dem reservierungsgebundenen Modell zu erstellen, sehen Sie sich eine der folgenden Optionen an:
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[],[],null,["# Compute Engine instances provisioning models\n\nLinux Windows\n\n*** ** * ** ***\n\nThis document describes the provisioning models for Compute Engine instances.\nTo learn more about deployment options, see\n[Choose a Compute Engine deployment strategy for your workload](/compute/docs/choose-compute-deployment-option).\n\n*Provisioning models* determine the availability, lifespan, and pricing of your\ninstances. If you understand these models, then you can choose the best option\nfor your workload.\n\nAvailable provisioning models\n-----------------------------\n\nWhen you create a compute instance, you can specify one of the following\nprovisioning models. If you don't specify a provisioning model, then\nCompute Engine uses the standard provisioning model by default.\n\n- Standard\n\n- Spot\n\n- Flex-start ([Preview](/products#product-launch-stages))\n\n- Reservation-bound\n\nThe following table helps you compare the use cases and pricing for each\nprovisioning model:\n\nInstance availability and lifespan\n----------------------------------\n\nThe following table shows you the compute instances availability and lifespan\nfor each provisioning model:\n\nWhat's next\n-----------\n\n- Read an\n [overview of creating Compute Engine instances](/compute/docs/instances/instance-creation-overview).\n\n- To create instances by using the spot provisioning model, see\n [Spot VMs](/compute/docs/instances/spot).\n\n- To create instances by using the flex-start provisioning model, see\n [About resize requests in a MIG](/compute/docs/instance-groups/about-resize-requests-mig).\n\n- To reserve capacity to create instances by using the reservation-bound\n model, see one of the following options:\n\n - [About future reservation requests in calendar mode](/compute/docs/instances/future-reservations-calendar-mode-overview)\n\n - [Reserve capacity in AI Hypercomputer](/ai-hypercomputer/docs/reserve-capacity)"]]