In diesem Dokument wird beschrieben, wie Sie Instanzen mit angehängten GPUs aus der A3 Ultra- oder A4-Maschinenserie erstellen. Weitere Informationen zum Erstellen von Instanzen mit angehängten GPUs finden Sie unter Instanz mit angehängten GPUs erstellen – Übersicht.
Die Maschinenserien A4 und A3 Ultra wurden entwickelt, um die Ausführung von KI/ML-Clustern im großen Maßstab mit Funktionen wie der gezielten Platzierung von Arbeitslasten, erweiterten Steuerelementen für die Clusterwartung und topologiebewusster Planung zu ermöglichen. Weitere Informationen finden Sie unter Clusterverwaltung – Übersicht.
Hinweise
- Informationen zu Einschränkungen und zusätzlichen erforderlichen Schritten zum Erstellen von Instanzen mit angehängten GPUs, z. B. zum Auswählen eines Betriebssystem-Images oder zum Prüfen des GPU-Kontingents, finden Sie unter Übersicht zum Erstellen einer Instanz mit angehängten GPUs.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud init
Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
- Set a default region and zone.
REST
Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud init
Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Erstellen von Instanzen benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) für das Projekt zu gewähren. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Instanzen erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind zum Erstellen von Instanzen erforderlich:
compute.instances.create
für das Projekt-
So erstellen Sie die VM mit einem benutzerdefinierten Image:
compute.images.useReadOnly
für das Image -
Um die VM mit einem Snapshot zu erstellen:
compute.snapshots.useReadOnly
für den Snapshot -
So verwenden Sie eine Instanzvorlage zum Erstellen der VM:
compute.instanceTemplates.useReadOnly
für die Instanzvorlage -
So geben Sie ein Subnetz für Ihre VM an:
compute.subnetworks.use
für das Projekt oder für das ausgewählte Subnetz -
Um eine statische IP-Adresse für die VM festzulegen:
compute.addresses.use
für das Projekt -
So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein VPC-Netzwerk verwenden:
compute.subnetworks.useExternalIp
für das Projekt oder für das ausgewählte Subnetz -
So weisen Sie der VM ein Legacy-Netzwerk zu:
compute.networks.use
für das Projekt -
So weisen Sie der VM eine externe IP-Adresse zu, wenn Sie ein Legacy-Netzwerk verwenden:
compute.networks.useExternalIp
für das Projekt -
Um Metadaten der VM-Instanz für die VM festzulegen:
compute.instances.setMetadata
für das Projekt -
Zum Festlegen von Tags für die VM:
compute.instances.setTags
auf der VM -
So legen Sie Labels für die VM fest:
compute.instances.setLabels
auf der VM -
So legen Sie ein Dienstkonto für die VM fest:
compute.instances.setServiceAccount
auf der VM -
Um ein neues Laufwerk für die VM zu erstellen:
compute.disks.create
für das Projekt -
So hängen Sie ein vorhandenes Laufwerk im Lese- oder Lese-/Schreibmodus an:
compute.disks.use
für das Laufwerk -
So hängen Sie ein vorhandenes Laufwerk im Lesemodus an:
compute.disks.useReadOnly
für das Laufwerk
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Festlegen, wie A3 Ultra- oder A4-Instanzen erstellt werden
So ermitteln Sie die Optionen, die Sie zum Erstellen von A3 Ultra- oder A4-Instanzen verwenden möchten:
Verbrauchsoption auswählen: Informationen zum Auswählen einer Verbrauchsoption für eine A3 Ultra- oder A4-Instanz finden Sie in der AI Hypercomputer-Dokumentation unter Verbrauchsoption auswählen.
Kapazität erhalten: Informationen dazu, wie Sie Kapazität für A3 Ultra- oder A4-Instanzen für die von Ihnen gewählte Verbrauchsoption erhalten, finden Sie in der AI Hypercomputer-Dokumentation unter Kapazitätsübersicht.
Anleitung zum Erstellen auswählen: Informationen zu allen Optionen, die Sie zum Erstellen von A3 Ultra- oder A4-Instanzen verwenden können, z. B. verwaltete Instanzgruppen (MIGs) oder Cluster, finden Sie in der AI Hypercomputer-Dokumentation unter Übersicht über das Erstellen von VMs und Clustern.
Wenn Sie die Clusterverwaltungsfunktionen von A3 Ultra oder A4 verwenden möchten oder keine eigenständigen Instanzen erstellen möchten, wählen Sie stattdessen eine Erstellungsoption in der AI Hypercomputer-Dokumentation aus.
A3 Ultra- oder A4-Instanz erstellen
So erstellen Sie eine A3 Ultra- oder A4-Instanz:
VPC-Netzwerke erstellen
Wenn Sie das Netzwerk für den Maschinentyp A4 oder A3 Ultra einrichten möchten, erstellen Sie drei VPC-Netzwerke für die folgenden Netzwerkschnittstellen:
- 2 reguläre VPC-Netzwerke für die gVNIC-Netzwerkschnittstellen (NIC). Sie werden für die Host-zu-Host-Kommunikation verwendet.
- Für die CX-7-NICs ist ein VPC-Netzwerk mit dem RoCE-Netzwerkprofil erforderlich. Das RoCE-VPC-Netzwerk muss acht Subnetze haben, ein Subnetz für jede CX-7-NIC. Diese NICs verwenden RDMA over Converged Ethernet (RoCE) und bieten so die Kommunikation mit hoher Bandbreite und niedriger Latenz, die für die GPU-zu-GPU-Kommunikation unerlässlich ist.
Weitere Informationen zur NIC-Anordnung finden Sie unter Netzwerkbandbreite und NIC-Anordnung prüfen.
Erstellen Sie die Netzwerke entweder manuell anhand der Anleitungen oder automatisch mit dem bereitgestellten Script.
Anleitungen
So erstellen Sie die Netzwerke:
- Informationen zum Erstellen der regulären VPC-Netzwerke für die gVNICs finden Sie unter VPC-Netzwerke erstellen und verwalten.
- Informationen zum Erstellen des RoCE-VPC-Netzwerks finden Sie unter VPC-Netzwerk für RDMA-NICs erstellen.
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen. Für den Maschinentyp „A4“ oder „A3 Ultra“ wird eine MTU von
8896
Byte empfohlen. Die empfohlenen MTU-Einstellungen für andere GPU-Maschinentypen finden Sie unter MTU-Einstellungen für GPU-Maschinentypen.Skript
So erstellen Sie die Netzwerke:
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen. Für den Maschinentyp „A4“ oder „A3 Ultra“ wird eine MTU von
8896
Byte empfohlen. Die empfohlenen MTU-Einstellungen für andere GPU-Maschinentypen finden Sie unter MTU-Einstellungen für GPU-Maschinentypen.Verwenden Sie das folgende Skript, um VPC-Netzwerke für die gVNICs und CX-7-NICs zu erstellen.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs done
Ersetzen Sie Folgendes:
GVNIC_NAME_PREFIX
: Das benutzerdefinierte Namenspräfix, das für die regulären VPC-Netzwerke und ‑Subnetze für die gVNICs verwendet werden soll.RDMA_NAME_PREFIX
: Das benutzerdefinierte Namenspräfix, das für das RoCE-VPC-Netzwerk und die Subnetze für die CX-7-NICs verwendet werden soll.ZONE
: Geben Sie eine Zone an, in der der Maschinentyp, den Sie verwenden möchten, verfügbar ist, z. B.us-central1-a
. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.REGION
: die Region, in der Sie die Subnetze erstellen möchten. Diese Region muss der angegebenen Zone entsprechen. Wenn Ihre Zone beispielsweiseus-central1-a
ist, lautet Ihre Regionus-central1
.IP_RANGE
: Der IP-Bereich, der für die SSH-Firewallregeln verwendet werden soll.
- Optional: Wenn Sie prüfen möchten, ob die VPC-Netzwerkressourcen erfolgreich erstellt wurden, sehen Sie sich die Netzwerkeinstellungen in der Google Cloud Console an:
- Rufen Sie in der Google Cloud Console die Seite VPC-Netzwerke auf.
- Suchen Sie in der Liste nach den Netzwerken, die Sie im vorherigen Schritt erstellt haben.
- Klicken Sie auf den Namen des Netzwerks, um die Subnetze, Firewallregeln und andere Netzwerkeinstellungen aufzurufen.
Die Instanz erstellen
Verwenden Sie eine der folgenden Optionen, um eine Instanz zu erstellen.
Console
Rufen Sie in der Google Cloud Console die Seite Instanz erstellen auf.
Der Bildschirm Instanz erstellen wird angezeigt und enthält den Bereich Maschinenkonfiguration.
Führen Sie im Bereich Maschinenkonfiguration die folgenden Schritte aus:
Geben Sie unter Name einen Namen für Ihre Instanz an. Weitere Informationen finden Sie unter Konvention für Ressourcennamen.
Wählen Sie die Region und die Zone aus, in der Sie Kapazität reserviert haben.
Klicken Sie auf den Tab GPUs und führen Sie die folgenden Schritte aus:
Wählen Sie in der Liste GPU-Typ Ihren GPU-Typ aus.
Wählen Sie für A4-Instanzen NVIDIA B200 aus.
Wählen Sie für A3 Ultra-Instanzen NVIDIA H200 141 GB aus.
Wählen Sie in der Liste Anzahl der GPUs die Option 8 aus.
Klicken Sie im Navigationsmenü auf Betriebssystem und Speicher. Führen Sie im angezeigten Bereich Betriebssystem und Speicher die folgenden Schritte aus:
Klicken Sie auf Ändern. Der Bereich Konfiguration des Bootlaufwerks wird angezeigt.
Wählen Sie auf dem Tab Öffentliche Images ein empfohlenes Image aus. Eine Liste der empfohlenen Images finden Sie unter Betriebssysteme.
Klicken Sie auf Auswählen, um die Bootlaufwerksoptionen zu bestätigen.
Führen Sie die folgenden Schritte aus, um eine Instanz mit mehreren NICs zu erstellen. Andernfalls überspringen Sie diese Schritte, um eine Instanz mit einer einzelnen NIC zu erstellen.
Klicken Sie im Navigationsmenü auf Netzwerk. Führen Sie im angezeigten Bereich Networking (Netzwerk) die folgenden Schritte aus:
Führen Sie im Bereich Netzwerkschnittstellen die folgenden Schritte aus:
Löschen Sie die Standardnetzwerkschnittstelle. Wenn Sie die Schnittstelle löschen möchten, klicken Sie auf
Löschen.Klicken Sie auf Netzwerkschnittstelle hinzufügen. Mit dieser Option können Sie Netzwerkschnittstellen hinzufügen, die an die VPC-Netzwerke angehängt werden, die Sie im vorherigen Abschnitt erstellt haben. Beachten Sie beim Hinzufügen der Netzwerkschnittstellen Folgendes:
Wählen Sie für eine Netzwerkschnittstelle, die für die Host-zu-Host-Kommunikation verwendet wird, in den Listen Netzwerk und Subnetzwerk ein reguläres VPC-Netzwerk und ein Subnetz aus und legen Sie die Liste Netzwerkkarte auf gVNIC fest.
Wählen Sie für eine Netzwerkschnittstelle, die für die GPU-zu-GPU-Kommunikation verwendet wird, das RoCE-VPC-Netzwerk und das Subnetz aus den Listen Netzwerk und Subnetzwerk aus und legen Sie die Liste Netzwerkkarte für diese Netzwerkschnittstellen auf MRDMA fest.
Klicken Sie im Navigationsmenü auf Erweitert. Führen Sie dann die folgenden Schritte für das Bereitstellungsmodell aus, das Sie verwenden möchten.
Flex-Start
- Wählen Sie im Abschnitt Bereitstellungsmodell in der Liste VM-Bereitstellungsmodell die Option Flex-Start aus.
Geben Sie unter Anzahl der Stunden eingeben die maximale Zeit ein, die die VM ausgeführt werden soll. Der Wert muss zwischen 46 Sekunden (
0.01
) und sieben Tagen (168
oder 168 Stunden) liegen.Wählen Sie Wartezeit für VM-Erstellung festlegen aus.
Je nach den zonalen Anforderungen für Ihre Arbeitslast empfehlen wir, eine der folgenden Zeitspannen anzugeben, um die Wahrscheinlichkeit zu erhöhen, dass Ihre Anfrage zum Erstellen von VMs erfolgreich ist:
- Arbeitslasten mit strengen zonalen Anforderungen: Wenn für Ihre Arbeitslast die Erstellung der VM in einer bestimmten Zone erforderlich ist, geben Sie eine Dauer zwischen 90 Sekunden und 2 Stunden an. Je länger die Dauer ist, desto höher sind die Chancen, Ressourcen zu erhalten.
- Arbeitslasten ohne strenge zonale Anforderungen: Wenn die VM in einer beliebigen Zone innerhalb der Region ausgeführt werden kann, geben Sie eine Dauer von 0 Sekunden an oder deaktivieren Sie das Kästchen Wartezeit für die VM-Erstellung festlegen. Mit dieser Aktion wird angegeben, dass Compute Engine Ressourcen nur zuweist, wenn sie sofort verfügbar sind. Wenn die Anfrage zum Erstellen der VM fehlschlägt, weil Ressourcen nicht verfügbar sind, wiederholen Sie die Anfrage in einer anderen Zone.
Reservierungsgebunden
Klicken Sie auf Reservierung auswählen. Dadurch wird ein Bereich mit einer Liste der verfügbaren Reservierungen in der ausgewählten Zone geöffnet. Führen Sie in der Reservierungsliste die folgenden Schritte aus:
- Wählen Sie die Reservierung aus, die Sie für die VM verwenden möchten. Sie können auch einen bestimmten Block innerhalb der Reservierung auswählen.
- Klicken Sie auf Auswählen.
Spot
- Wählen Sie im Abschnitt Bereitstellungsmodell aus der Liste VM-Bereitstellungsmodell die Option Spot aus.
Optional: So wählen Sie die Beendigungsaktion aus, die ausgeführt wird, wenn Compute Engine die VM vorzeitig beendet:
- Maximieren Sie den Abschnitt Erweiterte Einstellungen für das VM-Bereitstellungsmodell.
- Wählen Sie in der Liste Bei VM-Beendigung eine der folgenden Optionen aus:
- Wählen Sie Beenden (Standardeinstellung) aus, um die VM während des vorzeitigen Beendens zu stoppen.
- Wählen Sie Löschen aus, um die VM während des vorzeitigen Beendens zu löschen.
Klicken Sie zum Erstellen und Starten der Instanz auf Erstellen.
gcloud
Verwenden Sie zum Erstellen der VM den Befehl
gcloud compute instances create
.Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=none \ --provisioning-model=FLEX_START \ --request-valid-for-duration=REQUEST_VALID_FOR_DURATION \ --max-run-duration=MAX_RUN_DURATION \ --instance-termination-action=DELETE \ --maintenance-policy=TERMINATE
Ersetzen Sie Folgendes:
VM_NAME
: der Name der VM.MACHINE_TYPE
ist der für die VM zu verwendende Maschinentyp. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY
: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Details zu Betriebssystemen.IMAGE_PROJECT
: die Projekt-ID des Betriebssystem-Images.ZONE
: die Zone, in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE
: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und ‑Subnetze mit gVNICs angegeben haben.RDMA_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze mit RDMA-NICs angegeben haben.REQUEST_VALID_FOR_DURATION
: die Dauer, für die die Anfrage zum Erstellen der VM gültig ist. Sie müssen den Wert als Anzahl der Tage, Stunden, Minuten oder Sekunden gefolgt vond
,h
,m
bzw.s
formatieren. Geben Sie beispielsweise30m
für 30 Minuten oder1d2h3m4s
für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Wenn Sie keine Dauer angeben, beträgt die Standarddauer 90 Sekunden.Je nach den zonalen Anforderungen für Ihre Arbeitslast empfehlen wir, eine der folgenden Zeitspannen anzugeben, um die Wahrscheinlichkeit zu erhöhen, dass Ihre Anfrage zum Erstellen von VMs erfolgreich ist:
- Arbeitslasten mit strengen zonalen Anforderungen: Wenn für Ihre Arbeitslast die Erstellung der VM in einer bestimmten Zone erforderlich ist, geben Sie eine Dauer zwischen 90 Sekunden und zwei Stunden an. Je länger die Dauer, desto höher die Wahrscheinlichkeit, Ressourcen zu erhalten.
- Arbeitslasten ohne strenge zonale Anforderungen: Wenn die VM in einer beliebigen Zone innerhalb der Region ausgeführt werden kann, geben Sie eine Dauer von null Sekunden (
0
) an. Dadurch wird festgelegt, dass Compute Engine Ressourcen nur zuweist, wenn sie sofort verfügbar sind. Wenn die Anfrage zum Erstellen der VM fehlschlägt, weil Ressourcen nicht verfügbar sind, wiederholen Sie die Anfrage in einer anderen Zone.
MAX_RUN_DURATION
: die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl der Tage, Stunden, Minuten oder Sekunden gefolgt vond
,h
,m
bzw.s
formatieren. Geben Sie beispielsweise30m
für 30 Minuten oder1d2h3m4s
für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.
Reservierungsgebunden
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=specific \ --reservation=RESERVATION \ --provisioning-model=RESERVATION_BOUND \ --instance-termination-action=TERMINATION_ACTION \ --maintenance-policy=TERMINATE
Ersetzen Sie Folgendes:
VM_NAME
: der Name der VM.MACHINE_TYPE
ist der für die VM zu verwendende Maschinentyp. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY
: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Details zu Betriebssystemen.IMAGE_PROJECT
: die Projekt-ID des Betriebssystem-Images.ZONE
: die Zone, in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE
: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und ‑Subnetze mit gVNICs angegeben haben.RDMA_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze mit RDMA-NICs angegeben haben.-
RESERVATION
: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie die Instanz in einem beliebigen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Wenn Sie mehrere Instanzen im selben Block erstellen möchten, wenden Sie beim Erstellen jeder Instanz dieselbe Richtlinie für kompakte Platzierung an, die eine Block-Colocation (
maxDistance=2
) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie die Instanz auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: Gibt an, ob Compute Engine die VM am Ende des Reservierungszeitraums beendet (STOP
) oder löscht (DELETE
).
Spot
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --provisioning-model=SPOT \ --instance-termination-action=TERMINATION_ACTION
Ersetzen Sie Folgendes:
VM_NAME
: der Name der VM.MACHINE_TYPE
ist der für die VM zu verwendende Maschinentyp. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY
: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Details zu Betriebssystemen.IMAGE_PROJECT
: die Projekt-ID des Betriebssystem-Images.ZONE
: die Zone, in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE
: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und ‑Subnetze mit gVNICs angegeben haben.RDMA_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze mit RDMA-NICs angegeben haben.TERMINATION_ACTION
: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP
(Standard) oderDELETE
.
REST
Senden Sie zum Erstellen der VM eine
POST
-Anfrage an die Methodeinstances.insert
.Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType": "NO_RESERVATION", }, "scheduling":{ "provisioningModel": "FLEX_START", "requestValidForDuration": { "seconds": REQUEST_VALID_FOR_DURATION }, "maxRunDuration": { "seconds": MAX_RUN_DURATION }, "instanceTerminationAction": "DELETE", "onHostMaintenance": "TERMINATE", } }
Ersetzen Sie Folgendes:
PROJECT_ID
: Die Projekt-ID des Projekts, in dem Sie die VM erstellen möchten.ZONE
: die Zone, in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.MACHINE_TYPE
ist der für die VM zu verwendende Maschinentyp. Weitere Informationen finden Sie unter GPU-Maschinentypen.VM_NAME
: der Name der VM.DISK_SIZE
: Die Größe des Bootlaufwerks in GB.IMAGE_PROJECT
: die Projekt-ID des Betriebssystem-Images.IMAGE_FAMILY
: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Details zu Betriebssystemen.NETWORK_PROJECT_ID
: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und ‑Subnetze mit gVNICs angegeben haben.REGION
: die Region des Subnetzwerks.RDMA_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze mit RDMA-NICs angegeben haben.REQUEST_VALID_FOR_DURATION
: die Dauer, für die die Anfrage zum Erstellen der VM gültig ist. Sie müssen den Wert als Anzahl der Tage, Stunden, Minuten oder Sekunden gefolgt vond
,h
,m
bzw.s
formatieren. Geben Sie beispielsweise30m
für 30 Minuten oder1d2h3m4s
für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Wenn Sie keine Dauer angeben, beträgt die Standarddauer 90 Sekunden.Je nach den zonalen Anforderungen für Ihre Arbeitslast empfehlen wir, eine der folgenden Zeitspannen anzugeben, um die Wahrscheinlichkeit zu erhöhen, dass Ihre Anfrage zum Erstellen von VMs erfolgreich ist:
- Arbeitslasten mit strengen zonalen Anforderungen: Wenn für Ihre Arbeitslast die Erstellung der VM in einer bestimmten Zone erforderlich ist, geben Sie eine Dauer zwischen 90 Sekunden und zwei Stunden an. Je länger die Dauer, desto höher die Wahrscheinlichkeit, Ressourcen zu erhalten.
- Arbeitslasten ohne strenge zonale Anforderungen: Wenn die VM in einer beliebigen Zone innerhalb der Region ausgeführt werden kann, geben Sie eine Dauer von null Sekunden (
0
) an. Dadurch wird festgelegt, dass Compute Engine Ressourcen nur zuweist, wenn sie sofort verfügbar sind. Wenn die Anfrage zum Erstellen der VM fehlschlägt, weil Ressourcen nicht verfügbar sind, wiederholen Sie die Anfrage in einer anderen Zone.
MAX_RUN_DURATION
: die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Sekunden formatieren. Geben Sie beispielsweise86400
für einen Tag an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.
Reservierungsgebunden
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION" ] }, "scheduling":{ "provisioningModel": "RESERVATION_BOUND", "instanceTerminationAction": "TERMINATION_ACTION", "onHostMaintenance": "TERMINATE", "automaticRestart": true } }
Ersetzen Sie Folgendes:
PROJECT_ID
: Die Projekt-ID des Projekts, in dem Sie die VM erstellen möchten.ZONE
: die Zone, in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.MACHINE_TYPE
ist der für die VM zu verwendende Maschinentyp. Weitere Informationen finden Sie unter GPU-Maschinentypen.VM_NAME
: der Name der VM.DISK_SIZE
: Die Größe des Bootlaufwerks in GB.IMAGE_PROJECT
: die Projekt-ID des Betriebssystem-Images.IMAGE_FAMILY
: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Details zu Betriebssystemen.NETWORK_PROJECT_ID
: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und ‑Subnetze mit gVNICs angegeben haben.REGION
: die Region des Subnetzwerks.RDMA_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze mit RDMA-NICs angegeben haben.-
RESERVATION
: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie die Instanz in einem beliebigen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Wenn Sie mehrere Instanzen im selben Block erstellen möchten, wenden Sie beim Erstellen jeder Instanz dieselbe Richtlinie für kompakte Platzierung an, die eine Block-Colocation (
maxDistance=2
) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie die Instanz auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: Gibt an, ob Compute Engine die VM am Ende des Reservierungszeitraums beendet (STOP
) oder löscht (DELETE
).
Spot
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "scheduling": { "provisioningModel": "SPOT", "instanceTerminationAction": "TERMINATION_ACTION" } }
Ersetzen Sie Folgendes:
PROJECT_ID
: Die Projekt-ID des Projekts, in dem Sie die VM erstellen möchten.ZONE
: die Zone, in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.MACHINE_TYPE
ist der für die VM zu verwendende Maschinentyp. Weitere Informationen finden Sie unter GPU-Maschinentypen.VM_NAME
: der Name der VM.DISK_SIZE
: Die Größe des Bootlaufwerks in GB.IMAGE_PROJECT
: die Projekt-ID des Betriebssystem-Images.IMAGE_FAMILY
: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Details zu Betriebssystemen.NETWORK_PROJECT_ID
: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und ‑Subnetze mit gVNICs angegeben haben.REGION
: die Region des Subnetzwerks.RDMA_NAME_PREFIX
: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze mit RDMA-NICs angegeben haben.TERMINATION_ACTION
: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP
(Standard) oderDELETE
.
Instanz für die Verwendung vorbereiten
Führen Sie die folgenden Schritte aus, um eine Instanz mit angehängten GPUs für die Verwendung vorzubereiten:
Damit eine A4- oder A3-Ultra-Instanz die angehängten GPUs verwenden kann, müssen auf der Instanz GPU-Treiber installiert sein. Sofern das Image in der Instanz nicht bereits die erforderlichen GPU-Treiber enthält, installieren Sie GPU-Treiber.
Wenn Sie im vorherigen Abschnitt eine Spot-VM erstellt haben, führen Sie die folgenden Schritte aus:
Informationen zum Vorbereiten Ihrer Spot-VM auf ein potenzielles vorzeitiges Beenden finden Sie unter Vorzeitiges Beenden von Spot-VMs verwalten.
Optional: Best Practices für Spot-VMs
Nächste Schritte
Informationen zum Überwachen der GPU-Leistung finden Sie unter GPU-Leistung überwachen.
Informationen zur Fehlerbehebung bei GPU-Instanzen finden Sie unter Fehlerbehebung bei GPU-VMs.
Weitere Informationen zu GPU-Plattformen
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-09-30 (UTC).
-