In diesem Dokument wird beschrieben, wie Sie eine VM-Instanz erstellen, die einen Maschinentyp aus der G2- oder G4-Maschinenserie verwendet. Diese beschleunigeroptimierten Maschinentypen der G-Serie eignen sich gut für die Ausführung grafikintensiver Anwendungen und kostengünstiger Inferenz für maschinelles Lernen (ML).
Sie können diese VMs als On-Demand-VMs erstellen. Um die Kosten zu senken, können Sie auch G2- und G4-Spot-VMs oder G2-Flex-Start-VMs erstellen. Weitere Informationen zum Erstellen von VMs mit angehängten GPUs finden Sie unter Übersicht zum Erstellen einer Instanz mit angehängten GPUs.
Wenn Sie mehrere G2- oder G4-VMs erstellen möchten, können Sie eine der folgenden Optionen verwenden:
- Verwaltete Instanzgruppen (MIGs): Für Arbeitslasten, die hohe Verfügbarkeit, Skalierbarkeit und automatische Reparaturen erfordern, können Sie eine MIG erstellen, die eine GPU-Instanzvorlage verwendet.
- Bulk-Erstellung von Instanzen: Wenn Sie eine große Anzahl unabhängiger Instanzen erstellen möchten, können Sie G2- und G4-VMs im Bulk erstellen.
Hinweise
- Informationen zu Einschränkungen und zusätzlichen erforderlichen Schritten zum Erstellen von Instanzen mit angehängten GPUs, z. B. zum Auswählen eines Betriebssystem-Images und zum Prüfen des GPU-Kontingents, finden Sie unter Übersicht zum Erstellen einer Instanz mit angehängten GPUs.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud init
Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
- Set a default region and zone.
REST
Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud init
Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Erstellen von VMs benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute-Instanzadministrator (Version 1) (
roles/compute.instanceAdmin.v1
) für das Projekt zu gewähren. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von VMs erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind zum Erstellen von VMs erforderlich:
compute.instances.create
für das Projekt-
So erstellen Sie die VM mit einem benutzerdefinierten Image:
compute.images.useReadOnly
für das Image -
Um die VM mit einem Snapshot zu erstellen:
compute.snapshots.useReadOnly
für den Snapshot -
So verwenden Sie eine Instanzvorlage zum Erstellen der VM:
compute.instanceTemplates.useReadOnly
für die Instanzvorlage -
So geben Sie ein Subnetz für Ihre VM an:
compute.subnetworks.use
für das Projekt oder für das ausgewählte Subnetz -
Um eine statische IP-Adresse für die VM festzulegen:
compute.addresses.use
für das Projekt -
So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein VPC-Netzwerk verwenden:
compute.subnetworks.useExternalIp
für das Projekt oder für das ausgewählte Subnetz -
So weisen Sie der VM ein Legacy-Netzwerk zu:
compute.networks.use
für das Projekt -
So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein Legacy-Netzwerk verwenden:
compute.networks.useExternalIp
für das Projekt -
Um Metadaten der VM-Instanz für die VM festzulegen:
compute.instances.setMetadata
für das Projekt -
Zum Festlegen von Tags für die VM:
compute.instances.setTags
auf der VM -
So legen Sie Labels für die VM fest:
compute.instances.setLabels
auf der VM -
So legen Sie ein Dienstkonto für die VM fest:
compute.instances.setServiceAccount
auf der VM -
Um ein neues Laufwerk für die VM zu erstellen:
compute.disks.create
für das Projekt -
So hängen Sie ein vorhandenes Laufwerk im Lese- oder Lese-/Schreibmodus an:
compute.disks.use
für das Laufwerk -
So hängen Sie ein vorhandenes Laufwerk im Lesemodus an:
compute.disks.useReadOnly
für das Laufwerk
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Instanz mit angehängten GPUs erstellen
Sie können eine beschleunigeroptimierte G2- oder G4-Instanz mit der Google Cloud Console, der Google Cloud CLI oder REST erstellen.
Console
Rufen Sie in der Google Cloud Console die Seite Instanz erstellen auf.
Geben Sie im Feld Name einen eindeutigen Namen für die Instanz ein. Weitere Informationen finden Sie unter Konvention für Ressourcennamen.
Wählen Sie eine Region und Zone aus, in denen diese GPU-Maschinentypen verfügbar sind. Weitere Informationen finden Sie unter GPU-Regionen und -Zonen.
Wählen Sie im Bereich „Maschinentypen“ die Option GPUs aus.
Wählen Sie im Menü GPU-Typ den GPU-Typ.
- Wählen Sie für G2-Instanzen
NVIDIA L4
aus. - Wählen Sie für G4-Instanzen
NVIDIA RTX PRO 6000
aus.
- Wählen Sie für G2-Instanzen
Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.
- Bei G4-Instanzen wird in der Konsole automatisch der entsprechende Maschinentyp basierend auf der Anzahl der ausgewählten GPUs ausgewählt.
Beachten Sie bei G2-Instanzen Folgendes:
- Wenn Sie eine GPU auswählen, können Sie aus einer Reihe von Maschinentypen mit voreingestellten Mengen an vCPUs und Arbeitsspeicher auswählen, die für Ihre Arbeitslasten geeignet sind.
- Wenn Sie zwei oder mehr GPUs auswählen, wird in der Console automatisch der entsprechende Maschinentyp basierend auf der Anzahl der ausgewählten GPUs ausgewählt.
Für G2-Instanzen können Sie auch benutzerdefinierte Maschinentypen angeben. Betätigen Sie die Schieberegler oder geben Sie die Werte in die Textfelder ein, um die Anzahl der vCPUs und den Speicherplatz für die Instanz anzugeben. In der Konsole wird eine Kostenschätzung für die Instanz angezeigt, wenn Sie die Anzahl der vCPUs und die Speichermenge ändern.
Optional: Die G2- und G4-Maschinenserien unterstützen NVIDIA RTX Virtual Workstations (vWS) für Grafikarbeitslasten. Wenn Sie grafikintensive Arbeitslasten auf Ihrer Instanz ausführen möchten, wählen Sie Virtual Workstation (NVIDIA GRID) aktivieren aus.
Konfigurieren Sie das Bootlaufwerk so:
- Klicken Sie im Bereich Betriebssystem und Speicher auf Ändern. Dadurch wird die Seite Konfiguration des Bootlaufwerks geöffnet.
Führen Sie auf der Seite Bootlaufwerkkonfiguration die folgenden Schritte aus:
- Wählen Sie auf dem Tab Öffentliche Images ein unterstütztes Compute Engine-Image oder Deep Learning VM Images aus.
- Geben Sie eine Bootlaufwerkgröße von mindestens 40 GiB an.
- Klicken Sie auf Auswählen, um die Bootlaufwerksoptionen zu bestätigen.
Optional: Fügen Sie lokale SSDs hinzu. Lokale SSDs können als schnelle Scratch Disks oder zum Einspeisen von Daten in die GPUs verwendet werden, während E/A-Engpässe vermieden werden. So fügen Sie Ihrer Instanz lokale SSDs hinzu:
- Klicken Sie im Bereich Betriebssystem und Speicher auf Lokale SSD hinzufügen.
- Wählen Sie für die Schnittstelle die Option NVMe aus.
- Wählen Sie unter Laufwerkskapazität die Anzahl der lokalen SSDs aus, die Sie anhängen möchten. Die maximale Anzahl lokaler SSD-Laufwerke pro Instanz finden Sie unter Grenzwerte für Maschinenserien für lokale SSDs.
Optional: Wenn Sie eine höhere Netzwerkbandbreite für Ihre
g4-standard-384
-Instanzen benötigen, konfigurieren Sie mehrere Netzwerkschnittstellen. Sie können bis zu zwei Netzwerkschnittstellen konfigurieren. Mit dieser Konfiguration wird eineg4-standard-384
-Instanz mit zwei Netzwerkschnittstellen (2‑mal 200 Gbit/s) erstellt. Führen Sie im Abschnitt Netzwerk die folgenden Schritte aus:- Maximieren Sie die Standardnetzwerkschnittstelle.
- Geben Sie das Netzwerk und das Subnetzwerk für die erste Schnittstelle an.
- Wählen Sie für Netzwerkkarte die Option gVNIC aus.
Klicken Sie auf Netzwerkschnittstelle hinzufügen, um die zweite Schnittstelle hinzuzufügen. Konfigurieren Sie die zweite Netzwerkschnittstelle so:
- Wählen Sie ein anderes VPC-Netzwerk und Subnetzwerk aus. Jede Netzwerkschnittstelle muss sich in einem eindeutigen VPC-Netzwerk befinden.
- Wählen Sie für Netzwerkkarte die Option gVNIC aus.
Optional: Konfigurieren Sie ein anderes Bereitstellungsmodell, um Ihre Kosten zu senken. Wählen Sie im Abschnitt Erweiterte Optionen unter VM-Bereitstellungsmodell eine der folgenden Optionen aus:
(G2 only) Flex-Start: für kurzzeitige Arbeitslasten, bei denen eine flexible Startzeit möglich ist. Weitere Informationen finden Sie unter Flex-Start-VMs.
Spot: für fehlertolerante Arbeitslasten, die vorzeitig beendet werden können. Weitere Informationen finden Sie unter Spot-VMs.
Optional: Wählen Sie in der Liste Beim Beenden der VM aus, was passiert, wenn Compute Engine die Spot-VMs vorzeitig beendet oder die Flex-Start-VMs das Ende ihrer Laufzeit erreichen:
- Wählen Sie Beenden (Standardeinstellung) aus, um die VM während des vorzeitigen Beendens zu stoppen.
- Wählen Sie Löschen aus, um die VM während des vorzeitigen Beendens zu löschen.
Klicken Sie zum Erstellen und Starten der VM auf Erstellen.
gcloud
Verwenden Sie zum Erstellen und Starten einer Instanz den Befehl
gcloud compute instances create
. Der folgende Befehl enthält die erforderlichen Flags. Ersetzen Sie Folgendes:gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --zone=ZONE \ --boot-disk-size=DISK_SIZE \ --image=IMAGE \ --image-project=IMAGE_PROJECT \ --maintenance-policy=TERMINATE \ --restart-on-failure
VM_NAME
: Der Name der neuen Instanz.MACHINE_TYPE
: Der ausgewählte Maschinentyp Wählen Sie eine der folgenden Optionen aus:- Ein G4-Maschinentyp.
- Ein G2-Maschinentyp.
G2-Maschinentypen unterstützen auch benutzerdefinierten Arbeitsspeicher. Der Arbeitsspeicher muss ein Vielfaches von 1.024 MB sein und innerhalb des unterstützten Arbeitsspeicherbereichs liegen. Geben Sie beispielsweise
--machine-type=g2-custom-4-19456
an, um eine Instanz mit 4 vCPUs und 19 GB Arbeitsspeicher zu erstellen.
ZONE
: Die Zone für die Instanz. Diese Zone muss das ausgewählte GPU-Modell unterstützen.DISK_SIZE
: die Größe Ihres Bootlaufwerks in GiB. Geben Sie eine Bootlaufwerkgröße von mindestens 40 GiB an.IMAGE
: Ein Betriebssystem-Image, das GPUs unterstützt. Wenn Sie das neueste Image in einer Image-Familie verwenden möchten, ersetzen Sie das Flag--image
durch das Flag--image-family
und legen Sie dessen Wert auf eine Image-Familie fest, die GPUs unterstützt. Beispiel:--image-family=rocky-linux-8-optimized-gcp
.
Sie können auch ein benutzerdefiniertes Image oder Deep Learning VM Images angeben.IMAGE_PROJECT
: Das Compute Engine-Image-Projekt, zu dem das Betriebssystem-Image gehört. Wenn Sie ein benutzerdefiniertes Image oder Deep Learning VM Images verwenden, geben Sie das Projekt an, zu dem diese Images gehören.
Optionale Flags
Wenn Sie Ihre Instanz weiter konfigurieren möchten, um die Anforderungen Ihrer Arbeitslast oder Ihres Betriebssystems zu erfüllen, fügen Sie beim Ausführen des
gcloud compute instances create
-Befehls ein oder mehrere der folgenden Flags ein.Funktion Beschreibung Bereitstellungsmodell Legt das Bereitstellungsmodell für die Instanz fest. Geben Sie entweder SPOT
oderFLEX_START
an.FLEX_START
wird für G4-Instanzen nicht unterstützt. Wenn Sie kein Modell angeben, wird das Standardmodell verwendet. Weitere Informationen finden Sie unter Bereitstellungsmodelle für Compute Engine-Instanzen.--provisioning-model=PROVISIONING_MODEL
Virtuelle Workstation Gibt eine virtuelle NVIDIA RTX-Workstation (vWS) für Grafikarbeitslasten an. --accelerator=type=VWS_ACCELERATOR_TYPE,count=VWS_ACCELERATOR_COUNT
Ersetzen Sie Folgendes:
- Wählen Sie für
VWS_ACCELERATOR_TYPE
eine der folgenden Optionen aus:- Geben Sie für G4-Instanzen
nvidia-rtx-pro-6000-vws
an. - Geben Sie für G2-Instanzen
nvidia-l4-vws
an.
- Geben Sie für G4-Instanzen
- Geben Sie für
VWS_ACCELERATOR_COUNT
die Anzahl der benötigten virtuellen GPUs an.
Lokale SSD Hängt Ihrer Instanz eine oder mehrere lokale SSDs an. Lokale SSDs können als schnelle Scratch Disks oder zum Einspeisen von Daten in die GPUs verwendet werden, während E/A-Engpässe vermieden werden. Die maximale Anzahl lokaler SSD-Laufwerke, die Sie pro VM-Instanz anhängen können, finden Sie unter Grenzwerte für lokale SSDs.--local-ssd=interface=nvme \ --local-ssd=interface=nvme \ --local-ssd=interface=nvme ...
Netzwerkschnittstelle Hängt mehrere Netzwerkschnittstellen an Ihre Instanz an. Für g4-standard-384
-Instanzen können Sie bis zu zwei Netzwerkschnittstellen anhängen. Mit diesem Flag können Sie eine Instanz mit zwei Netzwerkschnittstellen (2 × 200 Gbit/s) erstellen. Jede Netzwerkschnittstelle muss sich in einem eindeutigen VPC-Netzwerk befinden.--network-interface=network=VPC_NAME_1,subnet=SUBNET_NAME_1,nic-type=GVNIC \ --network-interface=network=VPC_NAME_2,subnet=SUBNET_NAME_2,nic-type=GVNIC
Duale Netzwerkschnittstellen werden nur auf
g4-standard-384
-Maschinentypen unterstützt.Ersetzen Sie Folgendes:
VPC_NAME
: der Name Ihres VPC-Netzwerks.SUBNET_NAME
: der Name des Subnetzes, das Teil des angegebenen VPC-Netzwerk ist.
REST
Senden Sie eine POST-Anfrage an die Methode
instances.insert
. Da für Instanzen mit GPUs keine Live-Migration möglich ist, müssen Sie den ParameteronHostMaintenance
aufTERMINATE
setzen. Der folgende Befehl enthält die erforderlichen Flags. Ersetzen Sie Folgendes:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "disks":[ { "type":"projects/PROJECT_ID/zones/ZONE/diskTypes/hyperdisk-balanced", "initializeParams":{ "diskSizeGb":"DISK_SIZE", "sourceImage":"SOURCE_IMAGE_URI" }, "boot":true } ], "name":"VM_NAME", "networkInterfaces":[ { "network":"projects/PROJECT_ID/global/networks/NETWORK" } ], "scheduling":{ "onHostMaintenance":"terminate", "automaticRestart":true } }
VM_NAME
: Der Name der neuen Instanz.PROJECT_ID
: Ihre Projekt-IDZONE
: Die Zone für die Instanz. Diese Zone muss das ausgewählte GPU-Modell unterstützen.MACHINE_TYPE
: Der ausgewählte Maschinentyp Wählen Sie eine der folgenden Optionen aus:- Ein G4-Maschinentyp.
- Ein G2-Maschinentyp.
G2-Maschinentypen unterstützen auch benutzerdefinierten Arbeitsspeicher. Der Arbeitsspeicher muss ein Vielfaches von 1.024 MB sein und innerhalb des unterstützten Arbeitsspeicherbereichs liegen. Der Maschinentypname für eine Instanz mit 4 vCPUs und 19 GB Arbeitsspeicher wäre beispielsweise
g2-custom-4-19456
.
SOURCE_IMAGE_URI
: Der URI für das spezifische Image oder die Image-Familie, die Sie verwenden möchten. Beispiel:- Spezifisches Image:
"sourceImage": "projects/rocky-linux-cloud/global/images/rocky-linux-8-optimized-gcp-v20220719"
- Imagefamilie:
"sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp"
- Spezifisches Image:
DISK_SIZE
: die Größe Ihres Bootlaufwerks in GiB. Geben Sie eine Bootlaufwerkgröße von mindestens 40 GiB an.
Optionale Flags
Wenn Sie Ihre Instanz weiter konfigurieren möchten, um die Anforderungen Ihrer Arbeitslast oder Ihres Betriebssystems zu erfüllen, fügen Sie beim Ausführen der Methode
instances.insert
ein oder mehrere der folgenden Flags ein.Funktion Beschreibung Bereitstellungsmodell Um die Kosten zu senken, können Sie ein anderes Bereitstellungsmodell angeben, indem Sie das Feld "provisioningModel": "PROVISIONING_MODEL"
dem Objektscheduling
in Ihrer Anfrage hinzufügen. Wenn Sie angeben, dass Spot-VMs erstellt werden sollen, werden die FelderonHostMaintenance
undautomaticRestart
ignoriert. Weitere Informationen finden Sie unter Bereitstellungsmodelle für Compute Engine-Instanzen."scheduling": { "onHostMaintenance": "terminate", "provisioningModel": "PROVISIONING_MODEL" }
Ersetzen Sie
PROVISIONING_MODEL
durch einen der folgenden Werte:STANDARD
: (Standard) Eine Standardinstanz.SPOT
: Eine Spot-VM.FLEX_START
: Eine Flex-Start-VM. Flex-Start-VMs werden bis zu sieben Tage lang ausgeführt und können Ihnen helfen, stark nachgefragte Ressourcen wie GPUs zu einem reduzierten Preis zu erwerben. Dieses Bereitstellungsmodell wird für G4-Instanzen nicht unterstützt.
Virtuelle Workstation Gibt eine virtuelle NVIDIA RTX-Workstation (vWS) für Grafikarbeitslasten an. "guestAccelerators": [ { "acceleratorCount": VWS_ACCELERATOR_COUNT, "acceleratorType": "projects/PROJECT_ID/zones/ZONE/acceleratorTypes/VWS_ACCELERATOR_TYPE" } ]
Ersetzen Sie Folgendes:
- Wählen Sie für
VWS_ACCELERATOR_TYPE
eine der folgenden Optionen aus:- Geben Sie für G4-Instanzen
nvidia-rtx-pro-6000-vws
an. - Geben Sie für G2-Instanzen
nvidia-l4-vws
an.
- Geben Sie für G4-Instanzen
- Geben Sie für
VWS_ACCELERATOR_COUNT
die Anzahl der benötigten virtuellen GPUs an.
Lokale SSD Hängt Ihrer Instanz eine oder mehrere lokale SSDs an. Lokale SSDs können als schnelle Scratch Disks oder zum Einspeisen von Daten in die GPUs verwendet werden, während E/A-Engpässe vermieden werden. Die maximale Anzahl lokaler SSD-Laufwerke, die Sie pro VM-Instanz anhängen können, finden Sie unter Grenzwerte für lokale SSDs.{ "type": "SCRATCH", "autoDelete": true, "initializeParams": { "diskType": "projects/PROJECT_ID/zones/ZONE/diskTypes/local-nvme-ssd" } }
Netzwerkschnittstelle Hängt mehrere Netzwerkschnittstellen an Ihre Instanz an. Für g4-standard-384
-Instanzen können Sie bis zu zwei Netzwerkschnittstellen anhängen. So wird eine Instanz mit zwei Netzwerkschnittstellen (2 × 200 Gbit/s) erstellt. Jede Netzwerkschnittstelle muss sich in einem eindeutigen VPC-Netzwerk befinden."networkInterfaces": [ { "network": "projects/PROJECT_ID/global/networks/VPC_NAME_1", "subnetwork": "projects/PROJECT_ID/regions/REGION/subnetworks/SUBNET_NAME_1", "nicType": "GVNIC" }, { "network": "projects/PROJECT_ID/global/networks/VPC_NAME_2", "subnetwork": "projects/PROJECT_ID/regions/REGION/subnetworks/SUBNET_NAME_2", "nicType": "GVNIC" } ]
Duale Netzwerkschnittstellen werden nur auf
g4-standard-384
-Maschinentypen unterstützt.Ersetzen Sie Folgendes:
VPC_NAME
: der Name Ihres VPC-Netzwerks.SUBNET_NAME
: der Name des Subnetzes, das Teil des angegebenen VPC-Netzwerk ist.
Treiber installieren
Nachdem Sie die Instanz erstellt haben, müssen Sie einen Treiber installieren, damit die GPU verwendet werden kann. Welchen Treiber Sie installieren müssen, hängt davon ab, ob Sie beim Erstellen der Instanz eine virtuelle NVIDIA RTX-Workstation (vWS) für Grafikarbeitslasten aktiviert haben.
- Wenn Sie keine virtuelle Workstation aktiviert haben, installieren Sie den GPU-Treiber auf Ihrer VM.
- Wenn Sie eine virtuelle Workstation aktiviert haben, installieren Sie einen Treiber für die virtuelle Workstation.
(Optional) GPU-Modus für mehrere Instanzen (nur G4)
Der MIG-Modus (Multi-Instance GPU) ist eine Funktion, die Sie auf einer unterstützten NVIDIA-GPU aktivieren können.
Nachdem Sie eine G4-Instanz erstellt haben, können Sie den MIG-Modus (Multi-Instance GPU) auf einer einzelnen NVIDIA RTX PRO 6000-GPU aktivieren, die an Ihre Maschine angehängt ist. Wenn der MIG-Modus aktiviert ist, wird die einzelne GPU in bis zu sieben unabhängige GPU-Instanzen partitioniert. Jede Instanz wird gleichzeitig ausgeführt und verfügt über einen eigenen Arbeitsspeicher, Cache und eigene Streaming-Multiprozessoren. Anschließend können Sie verschiedene Arbeitslasten parallel auf diesen GPU-Instanzen ausführen.
Weitere Informationen zur Verwendung von GPUs mit mehreren Instanzen finden Sie in der NVIDIA-Dokumentation unter Erste Schritte mit MIG.
Nächste Schritte
- Weitere Informationen zu GPU-Plattformen
- GPU-Hostwartungen
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-10-22 (UTC).
-