VM erstellen, die das reservierungsgebundene Modell verwendet

In diesem Dokument wird beschrieben, wie Sie eine eigenständige VM-Instanz mit dem reservierungsgebundenen Bereitstellungsmodell erstellen. Mit diesem Bereitstellungsmodell können Sie A4X-, A4- oder A3-Ultra-VMs erstellen, indem Sie vorreservierte Kapazität nutzen.

Weitere Methoden zum Erstellen von VMs mit dem reservierungsgebundenen Bereitstellungsmodell finden Sie in der AI Hypercomputer-Dokumentation unter Übersicht über Bereitstellungsoptionen.

Hinweise

  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

      gcloud init

      Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

    2. Set a default region and zone.

    REST

    Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

      Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

      gcloud init

      Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

    Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute-Instanzadministrator (v1) (roles/compute.instanceAdmin.v1) für das Projekt zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen von VMs mit dem reservierungsgebundenen Bereitstellungsmodell benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von VMs mit dem reservierungsgebundenen Bereitstellungsmodell erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um VMs mit dem reservierungsgebundenen Bereitstellungsmodell zu erstellen:

  • compute.instances.create für das Projekt
  • So erstellen Sie die VM mit einem benutzerdefinierten Image: compute.images.useReadOnly für das Image
  • Um die VM mit einem Snapshot zu erstellen: compute.snapshots.useReadOnly für den Snapshot
  • So verwenden Sie eine Instanzvorlage zum Erstellen der VM: compute.instanceTemplates.useReadOnly für die Instanzvorlage
  • So geben Sie ein Subnetz für Ihre VM an: compute.subnetworks.use für das Projekt oder für das ausgewählte Subnetz
  • Um eine statische IP-Adresse für die VM festzulegen: compute.addresses.use für das Projekt
  • So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein VPC-Netzwerk verwenden: compute.subnetworks.useExternalIp für das Projekt oder für das ausgewählte Subnetz
  • So weisen Sie der VM ein Legacy-Netzwerk zu: compute.networks.use für das Projekt
  • So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein Legacy-Netzwerk verwenden: compute.networks.useExternalIp für das Projekt
  • Um Metadaten der VM-Instanz für die VM festzulegen: compute.instances.setMetadata für das Projekt
  • Zum Festlegen von Tags für die VM: compute.instances.setTags auf der VM
  • So legen Sie Labels für die VM fest: compute.instances.setLabels auf der VM
  • So legen Sie ein Dienstkonto für die VM fest: compute.instances.setServiceAccount auf der VM
  • Um ein neues Laufwerk für die VM zu erstellen: compute.disks.create für das Projekt
  • So hängen Sie ein vorhandenes Laufwerk im Lese- oder Lese-/Schreibmodus an: compute.disks.use für das Laufwerk
  • So hängen Sie ein vorhandenes Laufwerk im Lesemodus an: compute.disks.useReadOnly für das Laufwerk

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

VM erstellen, die das reservierungsgebundene Bereitstellungsmodell verwendet

Wenn Sie eine A4X-, A4- oder A3-Ultra-VM mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, müssen Sie warten, bis die automatische Reservierung, die Sie verwenden möchten, ihre Startzeit erreicht hat. Außerdem muss die VM, die Sie erstellen möchten, alle folgenden Anforderungen erfüllen:

Im folgenden Beispiel wird eine zukünftige Reservierungsanfrage im Kalendermodus für fünf A3 Ultra-VMs erstellt. Anschließend wird eine A3 Ultra-VM erstellt, indem die automatisch erstellte Reservierung für die Anfrage genutzt wird.

Wenn Sie eine Beispiel-VM mit dem reservierungsgebundenen Bereitstellungsmodell erstellen möchten, wählen Sie eine der folgenden Optionen aus:

Console

  1. Erstellen Sie eine Beispielanfrage für fünf A3 Ultra-VMs und senden Sie sie zur Überprüfung:

    1. Rufen Sie in der Google Cloud Console die Seite Reservierungen auf.

      Zu „Reservierungen“

    2. Klicken Sie auf den Tab Vorausschauende Reservierungen.

    3. Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Vorausschauende Reservierung erstellen wird angezeigt.

    4. Wählen Sie im Abschnitt Hardwarekonfiguration die Option Maschinentyp angeben aus und geben Sie eine A3 Ultra-Instanz an.

    5. Führen Sie im Bereich Methode zur Erreichbarkeit die folgenden Schritte aus:

      1. Wählen Sie Nach Kapazität für bis zu 90 Tage suchen aus.

      2. Geben Sie in den Listen Region und Zone die Region und Zone an, in der Ressourcen reserviert werden sollen. Wählen Sie für dieses Beispiel us-central1 bzw. us-central1-a aus.

      3. Geben Sie im Feld Total capacity needed (Benötigte Gesamtkapazität) den Wert 5 ein.

      4. Geben Sie im Abschnitt Reservierungszeitraum den Reservierungszeitraum für die Reservierung an.

    6. Geben Sie die restlichen Felder an und klicken Sie dann auf Senden.

  2. So erstellen Sie zur Startzeit der Anfrage eine A3 Ultra-VM, um die automatisch erstellte Beispielreservierung zu nutzen:

    1. Rufen Sie in der Google Cloud Console die Seite Instanz erstellen auf.

      Zur Seite „Instanz erstellen“

    2. Geben Sie im Feld Name einen Namen für die VM ein. Geben Sie für dieses Beispiel example-vm ein.

    3. Geben Sie die Region und die Zone an, in der Sie Ressourcen reservieren möchten. Wählen Sie für dieses Beispiel us-central1 bzw. us-central1-a aus.

    4. Klicken Sie auf den Tab GPUs und wählen Sie dann in der Liste GPU-Typ die Option NVIDIA H200 141 GB aus. Mit dieser Aktion wird eine A3 Ultra-VM angegeben und das Bereitstellungsmodell auf Reservierungsgebunden festgelegt.

    5. Klicken Sie im Navigationsmenü auf Erweitert.

    6. Wählen Sie im Bereich Reservierungen die Option Reservierung auswählen und dann Reservierung auswählen aus.

    7. Führen Sie im Bereich Reservierung auswählen die folgenden Schritte aus:

      1. Wählen Sie eine bestimmte Reservierung aus. Wenn Sie eine freigegebene Reservierung nutzen möchten, die in einem anderen Projekt vorhanden ist, wählen Sie in der Liste Projekt das Projekt aus, in dem sich die Reservierung befindet.

      2. Klicken Sie auf Auswählen.

    8. Maximieren Sie im Abschnitt Bereitstellungsmodell den Abschnitt Erweiterte Einstellungen für das VM-Bereitstellungsmodell.

    9. Wählen Sie in der Liste Bei VM-Beendigung die Option Beenden (Standardeinstellung) oder Löschen aus.

    10. Klicken Sie auf Erstellen.

gcloud

  1. Wenn Sie eine Beispielanfrage für fünf A3 Ultra-VMs erstellen und zur Überprüfung einreichen möchten, verwenden Sie den Befehl gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Angenommen, Google Cloud genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage am 5. Oktober 2025 erhöht Compute Engine die Anzahl der reservierten GPU-VMs in der Reservierung. Anschließend können Sie die Reservierung nutzen.

  2. Verwenden Sie zum Erstellen einer A3 Ultra-VM, um die automatisch erstellte Beispielreservierung zu nutzen, zur Startzeit der Anfrage den Befehl gcloud compute instances create mit den folgenden Flags:

    • Das Flag --instance-termination-action.

    • Das Flag --provisioning-model, das auf RESERVATION_BOUND gesetzt ist.

    • Das Flag --reservation.

    • Das Flag --reservation-affinity, das auf specific gesetzt ist.

    Der Befehl sieht in etwa so aus: Die vollständigen Anforderungen zum Erstellen einer A3-Ultra-VM finden Sie unter A3-Ultra- oder A4-Instanz erstellen.

    gcloud compute instance create example-vm  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    Der Befehl enthält die folgenden Werte:

    • TERMINATION_ACTION: Gibt an, ob Compute Engine die VM am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).

    • RESERVATION_URL: die URL der Reservierung, die so formatiert ist:

      • Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist: example-reservation.

      • Wenn die automatisch erstellte Reservierung in einem anderen Projekt vorhanden ist: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Wenn Sie eine Beispielanfrage für fünf A3 Ultra-VMs erstellen und zur Überprüfung einreichen möchten, senden Sie eine POST-Anfrage an die Beta-Methode futureReservations.insert:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Angenommen, Google Cloud genehmigt die Anfrage und Compute Engine erstellt automatisch eine leere Reservierung. Zur Startzeit der Anfrage am 5. Oktober 2025 erhöht Compute Engine die Anzahl der reservierten GPU-VMs in der Reservierung. Anschließend können Sie die Reservierung nutzen.

  2. Erstellen Sie zur Startzeit der Anfrage eine A3 Ultra-VM, um die automatisch erstellte Beispielreservierung zu nutzen. Senden Sie dazu eine POST-Anfrage an die Methode instances.insert. Geben Sie im Anfragetext die folgenden Felder an:

    • Das Feld reservationAffinity.consumeReservationType ist auf SPECIFIC_RESERVATION gesetzt.

    • Das Feld reservationAffinity.key ist auf compute.googleapis.com/reservation-name gesetzt.

    • Das Feld reservationAffinity.values ist auf die URL der Reservierung festgelegt.

    • Das Feld scheduling.instanceTerminationAction.

    • Das Feld scheduling.provisioningModel ist auf RESERVATION_BOUND gesetzt.

    Die Anfrage sieht in etwa so aus: Die vollständigen Anforderungen zum Erstellen einer A3-Ultra-VM finden Sie unter A3-Ultra- oder A4-Instanz erstellen.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-vm",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Der Anfragetext enthält die folgenden Werte:

    • RESERVATION_URL: die URL der Reservierung, die so formatiert ist:

      • Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist: example-reservation.

      • Wenn die automatisch erstellte Reservierung in einem anderen Projekt vorhanden ist: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: Gibt an, ob Compute Engine die VM am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).

Nächste Schritte

Überzeugen Sie sich selbst

Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Compute Engine in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Compute Engine kostenlos testen