Anfragen zur Größenanpassung in einer MIG erstellen


In diesem Dokument wird beschrieben, wie Sie Anfragen zur Größenänderung in einer verwalteten Instanzgruppe (Managed Instance Group, MIG) von VM-Instanzen mit angehängten GPUs erstellen.

Wenn Sie Anfragen zur Größenänderung in einer MIG erstellen, können Sie stark nachgefragte Ressourcen wie GPUs erhalten und die Kosten optimieren, indem Sie die genaue Anzahl von VMs auf einmal erstellen.

Hinweise

  • Lesen Sie Funktionsweise von Anfragen zur Größenänderung.
  • Prüfen Sie Ihr GPU-Kontingent, damit Ihr Kontingent für die angeforderten Ressourcen ausreicht.
  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und ‑APIs überprüft. Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich bei Compute Engine authentifizieren. Wählen Sie dazu eine der folgenden Optionen aus:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      Weitere Informationen finden Sie unter Für die Verwendung von REST authentifizieren in der Dokumentation zur Google Cloud-Authentifizierung.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen für das Projekt die IAM-Rolle Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen von Anfragen zur Größenanpassung in einer MIG benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Anfragen zur Größenanpassung in einer MIG erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um Anfragen zur Größenänderung in einer MIG zu erstellen:

  • Zum erstellen einer Instanzvorlage: compute.instanceTemplates.create für das Projekt
  • Zum Erstellen einer zonalen MIG: compute.instanceGroupManagers.create für das Projekt
  • Zum Erstellen von Anfragen zur Größenanpassung in einer MIG: compute.instanceGroupManagers.update für das Projekt

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

MIG für Anfragen zur Größenanpassung vorbereiten

Zum Erstellen von Anfragen zur Größenänderung in einer MIG müssen Sie eine Instanzvorlage und die MIG konfigurieren, wie in den folgenden Abschnitten beschrieben.

Instanzvorlage erstellen

Wenn Sie Anfragen zur Größenanpassung in einer MIG erstellen möchten, muss die MIG eine Instanzvorlage mit den folgenden Konfigurationen verwenden:

Wählen Sie eine der folgenden Optionen aus, um eine Instanzvorlage zu erstellen, die zum Erstellen von Größenanfragen in einer MIG konfiguriert ist:

Console

  1. Rufen Sie in der Google Cloud -Konsole die Seite Instanzvorlagen auf.

    Zu Instanzvorlagen

  2. Klicken Sie auf Instanzvorlage erstellen.

  3. Geben Sie im Feld Name einen Namen für die Instanzvorlage ein.

  4. Wählen Sie im Bereich Standort eine der folgenden Optionen aus:

    • Wenn Sie eine globale Instanzvorlage erstellen möchten, wählen Sie Global aus, falls dies noch nicht geschehen ist.

    • Um eine regionale Instanzvorlage zu erstellen, wählen Sie Regional und dann die Region aus, in der Sie die Instanzvorlage erstellen möchten.

  5. Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:

    1. Klicken Sie auf den Tab GPUs.

    2. Wählen Sie im Menü GPU-Typ den GPU-Typ.

    3. Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.

    4. Optional: Wenn Ihr GPU-Modell NVIDIA RTX Virtual Workstations (vWS) für Grafikarbeitslasten unterstützt und Sie grafikintensive Arbeitslasten ausführen möchten, wählen Sie Virtuelle aktivieren Workstation (NVIDIA GRID).

    5. Wählen Sie im Abschnitt Maschinentyp einen Maschinentyp aus.

  6. Optional: Klicken Sie im Abschnitt Bootlaufwerk auf Ändern, um den Standardwert für den Bootlaufwerktyp oder das Image zu ändern. Folgen Sie dann den Aufforderungen, um das Bootlaufwerk zu ändern.

  7. Maximieren Sie den Abschnitt Erweiterte Optionen und gehen Sie dann so vor:

    1. Maximieren Sie den Bereich Verwaltung.

    2. Wählen Sie im Menü Reservierungen die Option Nicht verwenden aus.

  8. Klicken Sie auf Erstellen.

gcloud

Verwenden Sie zum Erstellen einer Instanzvorlage, die zum Erstellen von Größenanfragen in einer MIG konfiguriert ist, den Befehl instance-templates create mit den folgenden Flags:

  • Das Flag --maintenance-policy, das auf TERMINATE gesetzt ist.

  • Das Flag --reservation-affinity, das auf none gesetzt ist.

Verwenden Sie beispielsweise den folgenden Befehl, um eine regionale Instanzvorlage zu erstellen: Wenn Sie eine globale Instanzvorlage erstellen möchten, verwenden Sie denselben Befehl ohne das --instance-template-region-Flag.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --image-project=IMAGE_PROJECT \
    --image-family=IMAGE_FAMILY \
    --instance-template-region=REGION \
    --machine-type=MACHINE_TYPE \
    --maintenance-policy=TERMINATE \
    --reservation-affinity=none

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der zu erstellenden Instanzvorlage.

  • IMAGE_PROJECT ist das Image-Projekt, das das Image enthält, z. B. debian-cloud. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.

  • IMAGE_FAMILY ist eine Image-Familie. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Sie debian-12 angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.

    Wenn Sie eine bestimmte Version des Betriebssystem-Images verwenden möchten, z. B. debian-12-buster-v20240701, ersetzen Sie das Flag --image-family durch das Flag --image.

  • REGION: Region, in der die Instanzvorlage erstellt werden soll.

  • MACHINE_TYPE ist ein Maschinentyp, der GPUs unterstützt. Wenn Sie einen N1-Maschinentyp angeben, fügen Sie das Flag --accelerator ein, um die Anzahl und den Typ der GPUs anzugeben, die an Ihre VMs angehängt werden sollen.

REST

Wenn Sie eine Instanzvorlage erstellen möchten, die zum Erstellen von Größenanfragen in einer verwalteten Instanzgruppe konfiguriert ist, senden Sie eine POST-Anfrage an eine der folgenden Methoden:

Gehen Sie im Anfragetext so vor:

  • Fügen Sie das Feld scheduling.onHostMaintenance ein und legen Sie es auf TERMINATE fest.

  • Fügen Sie das Feld reservationAffinity.consumeReservationType hinzu und setzen Sie es auf NO_RESERVATION.

So erstellen Sie beispielsweise eine regionale Instanzvorlage und senden eine POST-Anfrage:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates

{
  "name": "INSTANCE_TEMPLATE_NAME",
  "properties": {
    "disks": [
      {
        "boot": true,
        "initializeParams": {
          "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE"
        }
      }
    ],
    "machineType": "MACHINE_TYPE",
    "networkInterfaces": [
      {
        "network": "global/networks/default"
      }
    ],
    "reservationAffinity": {
      "consumeReservationType": "NO_RESERVATION"
    },
    "scheduling": {
      "onHostMaintenance": "TERMINATE"
    }
  }
}

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem die Instanzvorlage erstellt werden soll.

  • REGION: Region, in der die Instanzvorlage erstellt werden soll.

  • INSTANCE_TEMPLATE_NAME ist der Name der zu erstellenden Instanzvorlage.

  • IMAGE_PROJECT ist das Image-Projekt, das das Image enthält, z. B. debian-cloud. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.

  • IMAGE: Wählen Sie eine der folgenden Optionen aus:

    • Eine bestimmte Version des Betriebssystem-Images; Beispiel: debian-12-bookworm-v20240617.

    • Eine Image-Familie, die als family/IMAGE_FAMILY formatiert sein muss. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Sie family/debian-12 angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.

  • MACHINE_TYPE ist ein Maschinentyp, der GPUs unterstützt. Wenn Sie einen N1-Maschinentyp angeben, fügen Sie das Feld guestAccelerators in den Anfragetext ein, um die Anzahl und den Typ der GPUs anzugeben, die an Ihre VMs angehängt werden sollen.

Weitere Informationen zum Erstellen einer Instanzvorlage finden Sie unter Instanzvorlagen erstellen.

MIG erstellen oder aktualisieren

Nachdem Sie die Instanzvorlage erstellt haben, wie im vorherigen Abschnitt beschrieben, verwenden Sie sie, um gemäß der folgenden Anleitung eine MIG zu erstellen oder zu aktualisieren. Außerdem müssen Sie Folgendes tun, um die MIG auf Anfragen zur Größenänderung vorzubereiten:

Wählen Sie eine der folgenden Optionen aus, um eine MIG zu erstellen, die mit Anfragen zur Größenänderung kompatibel ist:

Console

  1. Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

    Zu den Instanzgruppen

  2. Klicken Sie auf Instanzgruppe erstellen.

    Die Seite Instanzgruppe erstellen wird geöffnet.

  3. Geben Sie im Feld Name einen Namen für die MIG ein.

  4. Wählen Sie in der Liste Instanzvorlage die Instanzvorlage aus, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage auswählen, wird die Liste Region auf die Region der Instanzvorlage festgelegt.

  5. Geben Sie im Abschnitt Standort an, ob Sie eine zonale oder eine regionale MIG erstellen möchten:

    1. Wenn Sie eine zonale MIG erstellen möchten, wählen Sie Einzelne Zone aus. Wenn Sie eine regionale MIG erstellen möchten, wählen Sie Mehrere Zonen aus.

    2. Wählen Sie die Region und die Zonen der MIG aus.

    3. Wenn Sie eine regionale MIG erstellen, gehen Sie so vor:

      1. Wählen Sie im Feld Zielverteilungsform die Option Beliebige einzelne Zone aus. Sie können diese Option erst auswählen, nachdem Sie in den nächsten Schritten die Autoscaling-Konfiguration gelöscht haben.

      2. Nachdem Sie die Option „Beliebige einzelne Zone“ ausgewählt haben, klicken Sie im angezeigten Dialogfeld auf Instanzumverteilung deaktivieren.

  6. So löschen Sie die Autoscaling-Konfiguration:

    1. Klicken Sie im Abschnitt Autoscaling auf die Liste Autoscaling-Modus und dann auf Autoscaling-Konfiguration löschen.

    2. Klicken Sie im Bestätigungsdialogfeld auf Löschen.

  7. So deaktivieren Sie die Reparaturen:

    1. Klicken Sie im Abschnitt Lebenszyklus von VM-Instanzen auf die Liste Standardaktion bei Fehler.

    2. Wählen Sie Keine Aktion aus.

  8. Führen Sie einen der folgenden Schritte aus:

    • So erstellen Sie jetzt eine Anfrage zur Größenanpassung:

      1. Geben Sie im Feld Anzahl der Instanzen die Anzahl der VMs ein, die Sie auf einmal erstellen möchten.

        Das Feld „Anzahl der Instanzen“ auf der Seite „Instanzgruppe erstellen“

      2. Klicken Sie das Kästchen Anfrage zur Größenanpassung verwenden, um VMs auf einmal zu erstellen an.

      3. Geben Sie im Feld Angeforderte Ausführungsdauer und in der Liste Einheit die Ausführungsdauer der VMs an. Die Dauer muss zwischen 1 Stunde und 7 Tagen liegen.

    • Geben Sie andernfalls im Feld Anzahl der Instanzen den Wert 0 ein. Sie können der Gruppe später VMs hinzufügen, indem Sie Anfragen zur Größenanpassung erstellen.

  9. Klicken Sie auf Erstellen.

gcloud

Verwenden Sie den Befehl instance-groups managed create, wobei das Flag --default-action-on-vm-failure auf do_nothing gesetzt ist. Wenn Sie eine regionale MIG erstellen, müssen Sie außerdem das Flag --target-distribution-shape auf any-single-zone und das Flag --instance-redistribution-type auf none setzen.

  • Führen Sie den folgenden Befehl aus, um eine zonale verwaltete Instanzgruppe zu erstellen:

    gcloud compute instance-groups managed create INSTANCE_GROUP_URL \
      --template=INSTANCE_TEMPLATE_NAME \
      --size=0 \
      --zone=ZONE \
      --default-action-on-vm-failure=do_nothing
    
  • Führen Sie den folgenden Befehl aus, um eine regionale verwaltete Instanzgruppe zu erstellen:

    gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \
        --template=INSTANCE_TEMPLATE_URL \
        --size=0 \
        --region=REGION \
        --target-distribution-shape=any-single-zone \
        --instance-redistribution-type=none \
        --default-action-on-vm-failure=do_nothing
    

Ersetzen Sie Folgendes:

  • INSTANCE_GROUP_NAME: Name der MIG, die erstellt werden soll.

  • INSTANCE_TEMPLATE_URL: Die teilweise URL der Instanzvorlage, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage zum Erstellen der MIG verwenden möchten, können Sie die MIG nur in der Region der Vorlage erstellen. Geben Sie einen der folgenden Werte an:

    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME

    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_NAME

  • ZONE: die Zone, in der die verwaltete Instanzgruppe erstellt werden soll.

  • REGION: die Region, in der die verwaltete Instanzgruppe erstellt werden soll.

REST

  • So erstellen Sie eine zonale MIG: Senden Sie eine POST-Anfrage mit der Methode instanceGroupManagers.insert:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
    
    {
      "versions": [
        {
          "instanceTemplate": "INSTANCE_TEMPLATE_URL"
        }
      ],
      "name": "INSTANCE_GROUP_NAME",
      "targetSize": 0,
      "instanceLifecyclePolicy": {
        "defaultActionOnFailure": "DO_NOTHING"
      }
    }
    
  • So erstellen Sie eine regionale MIG: Senden Sie eine POST-Anfrage mit der regionInstanceGroupManagers.insert-Methode:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
    
    {
      "versions": [
        {
          "instanceTemplate": "INSTANCE_TEMPLATE_URL"
        }
      ],
      "name": "INSTANCE_GROUP_NAME",
      "targetSize": 0,
      "distributionPolicy": {
        "targetShape": "ANY_SINGLE_ZONE"
      },
      "updatePolicy": {
        "instanceRedistributionType": "NONE"
      },
      "instanceLifecyclePolicy": {
        "defaultActionOnFailure": "DO_NOTHING"
      }
    }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem sich die im vorherigen Abschnitt erstellte Instanzvorlage befindet.

  • INSTANCE_TEMPLATE_URL: Die teilweise URL der Instanzvorlage, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage zum Erstellen der MIG verwenden möchten, können Sie die MIG nur in der Region der Vorlage erstellen. Geben Sie einen der folgenden Werte an:

    • Für eine regionale Instanzvorlage: regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME

    • Für eine globale Instanzvorlage: global/instanceTemplates/INSTANCE_TEMPLATE_NAME

  • ZONE: die Zone, in der die verwaltete Instanzgruppe erstellt werden soll.

  • REGION: die Region, in der die verwaltete Instanzgruppe erstellt werden soll.

  • INSTANCE_GROUP_NAME: Name der MIG, die erstellt werden soll.

Anfrage zur Größenanpassung in einer MIG erstellen

Bevor Sie Anfragen zur Größenanpassung erstellen, müssen Sie die MIG wie im vorherigen Abschnitt beschrieben vorbereitet haben.

Nachdem Sie eine Anfrage zur Größenänderung erstellt haben, wird die Anfrage akzeptiert und alle angeforderten Ressourcen werden verfügbar. Die MIG erstellt dann die angeforderte Anzahl von VMs auf einmal. Die VMs werden ausgeführt, bis die MIG sie nach Ablauf der angegebenen Ausführungsdauer löscht oder bis Sie sie löschen.

Wählen Sie eine der folgenden Optionen aus, um eine Anfrage zur Größenänderung in einer MIG zu erstellen:

Console

  1. Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

    Zu den Instanzgruppen

  2. Klicken Sie in der Spalte Name auf den Namen der MIG, in der die Anfrage zur Größenanpassung erstellt werden soll.

    Die Übersichtsseite der MIG wird geöffnet.

  3. Klicken Sie in der Zeile Anfrage zur Größenanpassung auf Anfragen zur Größenanpassung bearbeiten.

  4. Klicken Sie auf Neue Anfrage zur Größenanpassung.

    Der Bereich Neue Anfragen zur Größenanpassung wird angezeigt.

  5. Geben Sie im Feld Name den Namen der Anfrage ein.

  6. Geben Sie im Feld Anzahl erforderlicher zusätzlicher Instanzen die Anzahl der VMs ein, die der MIG gleichzeitig hinzugefügt werden sollen.

  7. Geben Sie in den Feldern Angeforderte Ausführungsdauer und Einheit die Dauer an, für die die angeforderten VMs ausgeführt werden sollen. Die Dauer muss zwischen 1 Stunde und 7 Tagen liegen.

  8. Klicken Sie auf Erstellen.

gcloud

  • Verwenden Sie den Befehl instance-groups managed resize-requests create, um eine Anfrage zur Größenänderung in einer zonalen MIG zu erstellen.

    gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \
        --resize-request=RESIZE_REQUEST_NAME \
        --resize-by=COUNT \
        --requested-run-duration=RUN_DURATION \
        --zone=ZONE
    
  • Verwenden Sie den Befehl beta instance-groups managed resize-requests create, um eine Anfrage zur Größenanpassung in einer regionalen MIG zu erstellen.

    gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \
        --resize-request=RESIZE_REQUEST_NAME \
        --resize-by=COUNT \
        --requested-run-duration=RUN_DURATION \
        --region=REGION
    

Ersetzen Sie Folgendes:

  • INSTANCE_GROUP_NAME ist der Name der MIG, die zum Erstellen von Anfragen zur Größenanpassung darin konfiguriert ist.

  • RESIZE_REQUEST_NAME ist der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.

  • COUNT ist die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.

  • RUN_DURATION ist die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt von d, h, m bzw. s formatiert werden. Geben Sie beispielsweise 30m für 30 Minuten oder 1d2h3m4s für 1 Tag, 2 Stunden, 3 Minuten und 4 Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.

  • ZONE: Die Zone, in der sich die MIG befindet.

  • REGION: Die Region, in der sich die MIG befindet.

REST

  • Wenn Sie eine Anfrage zur Größenänderung in einer zonalen MIG erstellen möchten, senden Sie eine POST-Anfrage mit der Methode instanceGroupManagerResizeRequests.insert.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
    
  • Wenn Sie eine Anfrage zur Größenänderung in einer regionalen MIG erstellen möchten, senden Sie eine POST-Anfrage mithilfe der Methode beta.regionInstanceGroupManagerResizeRequests.insert.

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
    

Geben Sie im Anfragetext Folgendes an:

{
  "name": "RESIZE_REQUEST_NAME",
  "resizeBy": COUNT,
  "requestedRunDuration": {
    "seconds": "RUN_DURATION"
  }
}

Ersetzen Sie Folgendes:

  • PROJECT_ID ist die ID des Projekts, in dem sich die angegebene MIG befindet.

  • ZONE: Die Zone, in der sich die MIG befindet.

  • REGION: Die Region, in der sich die MIG befindet.

  • INSTANCE_GROUP_NAME ist der Name der MIG, die zum Erstellen von Anfragen zur Größenanpassung darin konfiguriert ist.

  • RESIZE_REQUEST_NAME ist der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.

  • COUNT ist die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.

  • RUN_DURATION ist die Dauer in Sekunden, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss zwischen 600, d. h. 600 Sekunden (10 Minuten) und 604800, also 604.800 Sekunden (7 Tage) liegen.

Nachdem Sie eine Anfrage zur Größenanpassung erstellt haben, können Sie den Status prüfen oder Fehler beheben, indem Sie die Details der Anfrage zur Größenanpassung aufrufen.

Nächste Schritte