Diese Seite wurde von der Cloud Translation API übersetzt.

G2- oder G4-Instanz erstellen

Linux Windows

In diesem Dokument wird beschrieben, wie Sie eine VM-Instanz erstellen, die einen Maschinentyp aus der G2- oder G4-Maschinenserie verwendet. Diese beschleunigeroptimierten Maschinentypen der G-Serie eignen sich gut für die Ausführung grafikintensiver Anwendungen und kostengünstiger Inferenz für maschinelles Lernen (ML).

Sie können diese VMs als On-Demand-VMs erstellen. Um die Kosten zu senken, können Sie auch G2- und G4-Spot-VMs oder G2-Flex-Start-VMs erstellen. Weitere Informationen zum Erstellen von VMs mit angehängten GPUs finden Sie unter Übersicht zum Erstellen einer Instanz mit angehängten GPUs.

Wenn Sie mehrere G2- oder G4-VMs erstellen möchten, können Sie eine der folgenden Optionen verwenden:

Verwaltete Instanzgruppen (MIGs): Für Arbeitslasten, die hohe Verfügbarkeit, Skalierbarkeit und automatische Reparaturen erfordern, können Sie eine MIG erstellen, die eine GPU-Instanzvorlage verwendet.
Bulk-Erstellung von Instanzen: Wenn Sie eine große Anzahl unabhängiger Instanzen erstellen möchten, können Sie G2- und G4-VMs im Bulk erstellen.

Hinweise

Informationen zu Einschränkungen und zusätzlichen erforderlichen Schritten zum Erstellen von Instanzen mit angehängten GPUs, z. B. zum Auswählen eines Betriebssystem-Images und zum Prüfen des GPU-Kontingents, finden Sie unter Übersicht zum Erstellen einer Instanz mit angehängten GPUs.
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
  gcloud init
  Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
  
  Hinweis: Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die aktuelle Version haben, indem Sie gcloud components update ausführen.
2. Set a default region and zone.
REST

Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Um die Berechtigungen zu erhalten, die Sie zum Erstellen von VMs benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute-Instanzadministrator (Version 1) (roles/compute.instanceAdmin.v1) für das Projekt zu gewähren. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von VMs erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind zum Erstellen von VMs erforderlich:

compute.instances.create für das Projekt
So erstellen Sie die VM mit einem benutzerdefinierten Image: compute.images.useReadOnly für das Image
Um die VM mit einem Snapshot zu erstellen: compute.snapshots.useReadOnly für den Snapshot
So verwenden Sie eine Instanzvorlage zum Erstellen der VM: compute.instanceTemplates.useReadOnly für die Instanzvorlage
So geben Sie ein Subnetz für Ihre VM an: compute.subnetworks.use für das Projekt oder für das ausgewählte Subnetz
Um eine statische IP-Adresse für die VM festzulegen: compute.addresses.use für das Projekt
So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein VPC-Netzwerk verwenden: compute.subnetworks.useExternalIp für das Projekt oder für das ausgewählte Subnetz
So weisen Sie der VM ein Legacy-Netzwerk zu: compute.networks.use für das Projekt
So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein Legacy-Netzwerk verwenden: compute.networks.useExternalIp für das Projekt
Um Metadaten der VM-Instanz für die VM festzulegen: compute.instances.setMetadata für das Projekt
Zum Festlegen von Tags für die VM: compute.instances.setTags auf der VM
So legen Sie Labels für die VM fest: compute.instances.setLabels auf der VM
So legen Sie ein Dienstkonto für die VM fest: compute.instances.setServiceAccount auf der VM
Um ein neues Laufwerk für die VM zu erstellen: compute.disks.create für das Projekt
So hängen Sie ein vorhandenes Laufwerk im Lese- oder Lese-/Schreibmodus an: compute.disks.use für das Laufwerk
So hängen Sie ein vorhandenes Laufwerk im Lesemodus an: compute.disks.useReadOnly für das Laufwerk

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Instanz mit angehängten GPUs erstellen

Sie können eine beschleunigeroptimierte G2- oder G4-Instanz mit der Google Cloud Console, der Google Cloud CLI oder REST erstellen.

Console

Rufen Sie in der Google Cloud Console die Seite Instanz erstellen auf.

Zur Seite „Instanz erstellen“
Geben Sie im Feld Name einen eindeutigen Namen für die Instanz ein. Weitere Informationen finden Sie unter Konvention für Ressourcennamen.
Wählen Sie eine Region und Zone aus, in denen diese GPU-Maschinentypen verfügbar sind. Weitere Informationen finden Sie unter GPU-Regionen und -Zonen.
Wählen Sie im Bereich „Maschinentypen“ die Option GPUs aus.
1. Wählen Sie im Menü GPU-Typ den GPU-Typ.
  - Wählen Sie für G2-Instanzen NVIDIA L4 aus.
  - Wählen Sie für G4-Instanzen NVIDIA RTX PRO 6000 aus.
2. Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.
  - Bei G4-Instanzen wird in der Konsole automatisch der entsprechende Maschinentyp basierend auf der Anzahl der ausgewählten GPUs ausgewählt.
  - Beachten Sie bei G2-Instanzen Folgendes:
    - Wenn Sie eine GPU auswählen, können Sie aus einer Reihe von Maschinentypen mit voreingestellten Mengen an vCPUs und Arbeitsspeicher auswählen, die für Ihre Arbeitslasten geeignet sind.
    - Wenn Sie zwei oder mehr GPUs auswählen, wird in der Console automatisch der entsprechende Maschinentyp basierend auf der Anzahl der ausgewählten GPUs ausgewählt.
    Für G2-Instanzen können Sie auch benutzerdefinierte Maschinentypen angeben. Betätigen Sie die Schieberegler oder geben Sie die Werte in die Textfelder ein, um die Anzahl der vCPUs und den Speicherplatz für die Instanz anzugeben. In der Konsole wird eine Kostenschätzung für die Instanz angezeigt, wenn Sie die Anzahl der vCPUs und die Speichermenge ändern.
3. Optional: Die G2- und G4-Maschinenserien unterstützen NVIDIA RTX Virtual Workstations (vWS) für Grafikarbeitslasten. Wenn Sie grafikintensive Arbeitslasten auf Ihrer Instanz ausführen möchten, wählen Sie Virtual Workstation (NVIDIA GRID) aktivieren aus.
Konfigurieren Sie das Bootlaufwerk so:
1. Klicken Sie im Bereich Betriebssystem und Speicher auf Ändern. Dadurch wird die Seite Konfiguration des Bootlaufwerks geöffnet.
2. Führen Sie auf der Seite Bootlaufwerkkonfiguration die folgenden Schritte aus:
  1. Wählen Sie auf dem Tab Öffentliche Images ein unterstütztes Compute Engine-Image oder Deep Learning VM Images aus.
  2. Geben Sie eine Bootlaufwerkgröße von mindestens 40 GiB an.
  3. Klicken Sie auf Auswählen, um die Bootlaufwerksoptionen zu bestätigen.
Optional: Fügen Sie lokale SSDs hinzu. Lokale SSDs können als schnelle Scratch Disks oder zum Einspeisen von Daten in die GPUs verwendet werden, während E/A-Engpässe vermieden werden. So fügen Sie Ihrer Instanz lokale SSDs hinzu:
1. Klicken Sie im Bereich Betriebssystem und Speicher auf Lokale SSD hinzufügen.
2. Wählen Sie für die Schnittstelle die Option NVMe aus.
3. Wählen Sie unter Laufwerkskapazität die Anzahl der lokalen SSDs aus, die Sie anhängen möchten. Die maximale Anzahl lokaler SSD-Laufwerke pro Instanz finden Sie unter Grenzwerte für Maschinenserien für lokale SSDs.
Optional: Wenn Sie eine höhere Netzwerkbandbreite für Ihre g4-standard-384-Instanzen benötigen, konfigurieren Sie mehrere Netzwerkschnittstellen. Sie können bis zu zwei Netzwerkschnittstellen konfigurieren. Mit dieser Konfiguration wird eine g4-standard-384-Instanz mit zwei Netzwerkschnittstellen (2‑mal 200 Gbit/s) erstellt. Führen Sie im Abschnitt Netzwerk die folgenden Schritte aus:
1. Maximieren Sie die Standardnetzwerkschnittstelle.
2. Geben Sie das Netzwerk und das Subnetzwerk für die erste Schnittstelle an.
3. Wählen Sie für Netzwerkkarte die Option gVNIC aus.
4. Klicken Sie auf Netzwerkschnittstelle hinzufügen, um die zweite Schnittstelle hinzuzufügen. Konfigurieren Sie die zweite Netzwerkschnittstelle so:
  1. Wählen Sie ein anderes VPC-Netzwerk und Subnetzwerk aus. Jede Netzwerkschnittstelle muss sich in einem eindeutigen VPC-Netzwerk befinden.
  2. Wählen Sie für Netzwerkkarte die Option gVNIC aus.
Optional: Konfigurieren Sie ein anderes Bereitstellungsmodell, um Ihre Kosten zu senken. Wählen Sie im Abschnitt Erweiterte Optionen unter VM-Bereitstellungsmodell eine der folgenden Optionen aus:
- (G2 only) Flex-Start: für kurzzeitige Arbeitslasten, bei denen eine flexible Startzeit möglich ist. Weitere Informationen finden Sie unter Flex-Start-VMs.
- Spot: für fehlertolerante Arbeitslasten, die vorzeitig beendet werden können. Weitere Informationen finden Sie unter Spot-VMs.
Optional: Wählen Sie in der Liste Beim Beenden der VM aus, was passiert, wenn Compute Engine die Spot-VMs vorzeitig beendet oder die Flex-Start-VMs das Ende ihrer Laufzeit erreichen:
- Wählen Sie Beenden (Standardeinstellung) aus, um die VM während des vorzeitigen Beendens zu stoppen.
- Wählen Sie Löschen aus, um die VM während des vorzeitigen Beendens zu löschen.
Klicken Sie zum Erstellen und Starten der VM auf Erstellen.

gcloud

Verwenden Sie zum Erstellen und Starten einer Instanz den Befehl gcloud compute instances create. Der folgende Befehl enthält die erforderlichen Flags.

  gcloud compute instances create VM_NAME \
      --machine-type=MACHINE_TYPE \
      --zone=ZONE \
      --boot-disk-size=DISK_SIZE \
      --image=IMAGE \
      --image-project=IMAGE_PROJECT \
      --maintenance-policy=TERMINATE \
      --restart-on-failure

Ersetzen Sie Folgendes:

VM_NAME: Der Name der neuen Instanz.
MACHINE_TYPE: Der ausgewählte Maschinentyp Wählen Sie eine der folgenden Optionen aus:
- Ein G4-Maschinentyp.
- Ein G2-Maschinentyp. G2-Maschinentypen unterstützen auch benutzerdefinierten Arbeitsspeicher. Der Arbeitsspeicher muss ein Vielfaches von 1.024 MB sein und innerhalb des unterstützten Arbeitsspeicherbereichs liegen. Geben Sie beispielsweise --machine-type=g2-custom-4-19456 an, um eine Instanz mit 4 vCPUs und 19 GB Arbeitsspeicher zu erstellen.
ZONE: Die Zone für die Instanz. Diese Zone muss das ausgewählte GPU-Modell unterstützen.
DISK_SIZE: die Größe Ihres Bootlaufwerks in GiB. Geben Sie eine Bootlaufwerkgröße von mindestens 40 GiB an.
IMAGE: Ein Betriebssystem-Image, das GPUs unterstützt. Wenn Sie das neueste Image in einer Image-Familie verwenden möchten, ersetzen Sie das Flag --image durch das Flag --image-family und legen Sie dessen Wert auf eine Image-Familie fest, die GPUs unterstützt. Beispiel: --image-family=rocky-linux-8-optimized-gcp.
Sie können auch ein benutzerdefiniertes Image oder Deep Learning VM Images angeben.
IMAGE_PROJECT: Das Compute Engine-Image-Projekt, zu dem das Betriebssystem-Image gehört. Wenn Sie ein benutzerdefiniertes Image oder Deep Learning VM Images verwenden, geben Sie das Projekt an, zu dem diese Images gehören.

Optionale Flags

Wenn Sie Ihre Instanz weiter konfigurieren möchten, um die Anforderungen Ihrer Arbeitslast oder Ihres Betriebssystems zu erfüllen, fügen Sie beim Ausführen des gcloud compute instances create-Befehls ein oder mehrere der folgenden Flags ein.

Funktion	Beschreibung
Bereitstellungsmodell	Legt das Bereitstellungsmodell für die Instanz fest. Geben Sie entweder `SPOT` oder `FLEX_START` an. `FLEX_START` wird für G4-Instanzen nicht unterstützt. Wenn Sie kein Modell angeben, wird das Standardmodell verwendet. Weitere Informationen finden Sie unter Bereitstellungsmodelle für Compute Engine-Instanzen. --provisioning-model=`PROVISIONING_MODEL`
Virtuelle Workstation	Gibt eine virtuelle NVIDIA RTX-Workstation (vWS) für Grafikarbeitslasten an. --accelerator=type=`VWS_ACCELERATOR_TYPE`,count=`VWS_ACCELERATOR_COUNT` Ersetzen Sie Folgendes: Wählen Sie für `VWS_ACCELERATOR_TYPE` eine der folgenden Optionen aus: Geben Sie für G4-Instanzen `nvidia-rtx-pro-6000-vws` an. Geben Sie für G2-Instanzen `nvidia-l4-vws` an. Geben Sie für `VWS_ACCELERATOR_COUNT` die Anzahl der benötigten virtuellen GPUs an.
Lokale SSD	Hängt Ihrer Instanz eine oder mehrere lokale SSDs an. Lokale SSDs können als schnelle Scratch Disks oder zum Einspeisen von Daten in die GPUs verwendet werden, während E/A-Engpässe vermieden werden. --local-ssd=interface=nvme \ --local-ssd=interface=nvme \ --local-ssd=interface=nvme ... Die maximale Anzahl lokaler SSD-Laufwerke, die Sie pro VM-Instanz anhängen können, finden Sie unter Grenzwerte für lokale SSDs.
Netzwerkschnittstelle	Hängt mehrere Netzwerkschnittstellen an Ihre Instanz an. Für `g4-standard-384`-Instanzen können Sie bis zu zwei Netzwerkschnittstellen anhängen. Mit diesem Flag können Sie eine Instanz mit zwei Netzwerkschnittstellen (2 × 200 Gbit/s) erstellen. Jede Netzwerkschnittstelle muss sich in einem eindeutigen VPC-Netzwerk befinden. --network-interface=network=`VPC_NAME_1`,subnet=`SUBNET_NAME_1`,nic-type=GVNIC \ --network-interface=network=`VPC_NAME_2`,subnet=`SUBNET_NAME_2`,nic-type=GVNIC Duale Netzwerkschnittstellen werden nur auf `g4-standard-384`-Maschinentypen unterstützt. Ersetzen Sie Folgendes: `VPC_NAME`: der Name Ihres VPC-Netzwerks. `SUBNET_NAME`: der Name des Subnetzes, das Teil des angegebenen VPC-Netzwerk ist.

REST

Senden Sie eine POST-Anfrage an die Methode instances.insert. Da für Instanzen mit GPUs keine Live-Migration möglich ist, müssen Sie den Parameter onHostMaintenance auf TERMINATE setzen. Der folgende Befehl enthält die erforderlichen Flags.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances

{
   "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
   "disks":[
      {
         "type":"projects/PROJECT_ID/zones/ZONE/diskTypes/hyperdisk-balanced",
         "initializeParams":{
            "diskSizeGb":"DISK_SIZE",
            "sourceImage":"SOURCE_IMAGE_URI"
         },
         "boot":true
      }
   ],
   "name":"VM_NAME",
   "networkInterfaces":[
      {
         "network":"projects/PROJECT_ID/global/networks/NETWORK"
      }
   ],
   "scheduling":{
      "onHostMaintenance":"terminate",
      "automaticRestart":true
   }
}

Ersetzen Sie Folgendes:

VM_NAME: Der Name der neuen Instanz.
PROJECT_ID: Ihre Projekt-ID
ZONE: Die Zone für die Instanz. Diese Zone muss das ausgewählte GPU-Modell unterstützen.
MACHINE_TYPE: Der ausgewählte Maschinentyp Wählen Sie eine der folgenden Optionen aus:
- Ein G4-Maschinentyp.
- Ein G2-Maschinentyp. G2-Maschinentypen unterstützen auch benutzerdefinierten Arbeitsspeicher. Der Arbeitsspeicher muss ein Vielfaches von 1.024 MB sein und innerhalb des unterstützten Arbeitsspeicherbereichs liegen. Der Maschinentypname für eine Instanz mit 4 vCPUs und 19 GB Arbeitsspeicher wäre beispielsweise g2-custom-4-19456.
SOURCE_IMAGE_URI: Der URI für das spezifische Image oder die Image-Familie, die Sie verwenden möchten. Beispiel:
- Spezifisches Image: "sourceImage": "projects/rocky-linux-cloud/global/images/rocky-linux-8-optimized-gcp-v20220719"
- Imagefamilie: "sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp"
Wenn Sie eine Image-Familie angeben, erstellt Compute Engine eine Instanz aus dem neuesten nicht verworfenen Betriebssystem-Image in dieser Familie. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.
DISK_SIZE: die Größe Ihres Bootlaufwerks in GiB. Geben Sie eine Bootlaufwerkgröße von mindestens 40 GiB an.

Optionale Flags

Wenn Sie Ihre Instanz weiter konfigurieren möchten, um die Anforderungen Ihrer Arbeitslast oder Ihres Betriebssystems zu erfüllen, fügen Sie beim Ausführen der Methode instances.insert ein oder mehrere der folgenden Flags ein.

Funktion	Beschreibung
Bereitstellungsmodell	Um die Kosten zu senken, können Sie ein anderes Bereitstellungsmodell angeben, indem Sie das Feld `"provisioningModel": "PROVISIONING_MODEL"` dem Objekt `scheduling` in Ihrer Anfrage hinzufügen. Wenn Sie angeben, dass Spot-VMs erstellt werden sollen, werden die Felder `onHostMaintenance` und `automaticRestart` ignoriert. Weitere Informationen finden Sie unter Bereitstellungsmodelle für Compute Engine-Instanzen. "scheduling": { "onHostMaintenance": "terminate", "provisioningModel": "`PROVISIONING_MODEL`" } Ersetzen Sie `PROVISIONING_MODEL` durch einen der folgenden Werte: `STANDARD`: (Standard) Eine Standardinstanz. `SPOT`: Eine Spot-VM. `FLEX_START`: Eine Flex-Start-VM. Flex-Start-VMs werden bis zu sieben Tage lang ausgeführt und können Ihnen helfen, stark nachgefragte Ressourcen wie GPUs zu einem reduzierten Preis zu erwerben. Dieses Bereitstellungsmodell wird für G4-Instanzen nicht unterstützt.
Virtuelle Workstation	Gibt eine virtuelle NVIDIA RTX-Workstation (vWS) für Grafikarbeitslasten an. "guestAccelerators": [ { "acceleratorCount": `VWS_ACCELERATOR_COUNT`, "acceleratorType": "projects/`PROJECT_ID`/zones/`ZONE`/acceleratorTypes/`VWS_ACCELERATOR_TYPE`" } ] Ersetzen Sie Folgendes: Wählen Sie für `VWS_ACCELERATOR_TYPE` eine der folgenden Optionen aus: Geben Sie für G4-Instanzen `nvidia-rtx-pro-6000-vws` an. Geben Sie für G2-Instanzen `nvidia-l4-vws` an. Geben Sie für `VWS_ACCELERATOR_COUNT` die Anzahl der benötigten virtuellen GPUs an.
Lokale SSD	Hängt Ihrer Instanz eine oder mehrere lokale SSDs an. Lokale SSDs können als schnelle Scratch Disks oder zum Einspeisen von Daten in die GPUs verwendet werden, während E/A-Engpässe vermieden werden. { "type": "SCRATCH", "autoDelete": true, "initializeParams": { "diskType": "projects/`PROJECT_ID`/zones/`ZONE`/diskTypes/local-nvme-ssd" } } Die maximale Anzahl lokaler SSD-Laufwerke, die Sie pro VM-Instanz anhängen können, finden Sie unter Grenzwerte für lokale SSDs.
Netzwerkschnittstelle	Hängt mehrere Netzwerkschnittstellen an Ihre Instanz an. Für `g4-standard-384`-Instanzen können Sie bis zu zwei Netzwerkschnittstellen anhängen. So wird eine Instanz mit zwei Netzwerkschnittstellen (2 × 200 Gbit/s) erstellt. Jede Netzwerkschnittstelle muss sich in einem eindeutigen VPC-Netzwerk befinden. "networkInterfaces": [ { "network": "projects/`PROJECT_ID`/global/networks/`VPC_NAME_1`", "subnetwork": "projects/`PROJECT_ID`/regions/`REGION`/subnetworks/`SUBNET_NAME_1`", "nicType": "GVNIC" }, { "network": "projects/`PROJECT_ID`/global/networks/`VPC_NAME_2`", "subnetwork": "projects/`PROJECT_ID`/regions/`REGION`/subnetworks/`SUBNET_NAME_2`", "nicType": "GVNIC" } ] Duale Netzwerkschnittstellen werden nur auf `g4-standard-384`-Maschinentypen unterstützt. Ersetzen Sie Folgendes: `VPC_NAME`: der Name Ihres VPC-Netzwerks. `SUBNET_NAME`: der Name des Subnetzes, das Teil des angegebenen VPC-Netzwerk ist.

Treiber installieren

Nachdem Sie die Instanz erstellt haben, müssen Sie einen Treiber installieren, damit die GPU verwendet werden kann. Welchen Treiber Sie installieren müssen, hängt davon ab, ob Sie beim Erstellen der Instanz eine virtuelle NVIDIA RTX-Workstation (vWS) für Grafikarbeitslasten aktiviert haben.

Wenn Sie keine virtuelle Workstation aktiviert haben, installieren Sie den GPU-Treiber auf Ihrer VM.
Wenn Sie eine virtuelle Workstation aktiviert haben, installieren Sie einen Treiber für die virtuelle Workstation.

(Optional) GPU-Modus für mehrere Instanzen (nur G4)

Der MIG-Modus (Multi-Instance GPU) ist eine Funktion, die Sie auf einer unterstützten NVIDIA-GPU aktivieren können.

Nachdem Sie eine G4-Instanz erstellt haben, können Sie den MIG-Modus (Multi-Instance GPU) auf einer einzelnen NVIDIA RTX PRO 6000-GPU aktivieren, die an Ihre Maschine angehängt ist. Wenn der MIG-Modus aktiviert ist, wird die einzelne GPU in bis zu sieben unabhängige GPU-Instanzen partitioniert. Jede Instanz wird gleichzeitig ausgeführt und verfügt über einen eigenen Arbeitsspeicher, Cache und eigene Streaming-Multiprozessoren. Anschließend können Sie verschiedene Arbeitslasten parallel auf diesen GPU-Instanzen ausführen.

Weitere Informationen zur Verwendung von GPUs mit mehreren Instanzen finden Sie in der NVIDIA-Dokumentation unter Erste Schritte mit MIG.

Nächste Schritte

Weitere Informationen zu GPU-Plattformen
GPU-Hostwartungen