In diesem Dokument wird beschrieben, wie Sie einen Job erstellen und ausführen, der eine Grafikprozessoreinheit (GPU) verwendet. Weitere Informationen zu den Funktionen und Einschränkungen von GPUs finden Sie in der Compute Engine-Dokumentation unter GPUs.
Wenn Sie einen Batchjob erstellen, können Sie optional GPUs verwenden, um bestimmte Arbeitslasten zu beschleunigen. Gängige Anwendungsfälle für Jobs mit GPUs sind intensive Datenverarbeitung und Arbeitslasten für künstliche Intelligenz (KI) wie maschinelles Lernen (ML).
Hinweise
- Wenn Sie Batch noch nicht verwendet haben, lesen Sie den Hilfeartikel Batch-Dateien erstellen und ausführen und aktivieren Sie Batch, indem Sie die Voraussetzungen für Projekte und Nutzer erfüllen.
-
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen eines Jobs benötigen:
-
Batch-Job-Bearbeiter (
roles/batch.jobsEditor
) für das Projekt -
Dienstkontonutzer (
roles/iam.serviceAccountUser
) im Dienstkonto des Jobs, das standardmäßig das Compute Engine-Standarddienstkonto ist
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
-
Batch-Job-Bearbeiter (
Job erstellen, der GPUs verwendet
So erstellen Sie einen Job, der GPUs verwendet:
- Anforderungen für einen Job planen, der GPUs verwendet
- Erstellen Sie einen Job mit den von Ihnen ermittelten Anforderungen und Methoden. Beispiele zum Erstellen eines Jobs mit den empfohlenen Optionen finden Sie in diesem Dokument unter Beispieljob mit GPUs erstellen.
Anforderungen für einen Job mit GPUs planen
Bevor Sie einen Job erstellen, der GPUs verwendet, planen Sie die Anforderungen des Jobs wie in den folgenden Abschnitten beschrieben:
- GPU-Maschinentyp und Bereitstellungsmethode auswählen
- GPU-Treiber installieren
- Kompatible VM-Ressourcen definieren
Schritt 1: GPU-Maschinentyp und Bereitstellungsmethode auswählen
Die Anforderungen eines Jobs variieren je nach bevorzugtem GPU-Maschinentyp und Bereitstellungsmethode. Die Optionen für beide sind möglicherweise voneinander abhängig. Je nach Ihren Anforderungen und Prioritäten können Sie zuerst den GPU-Maschinentyp oder zuerst die Bereitstellungsmethode auswählen. Im Allgemeinen wirkt sich der GPU-Maschinentyp hauptsächlich auf die Leistung und die Grundpreise aus. Die Bereitstellungsmethode wirkt sich hauptsächlich auf die Ressourcenverfügbarkeit und zusätzliche Kosten oder Rabatte aus.
GPU-Maschinentyp auswählen
Die verfügbaren GPU-Maschinentypen (gültige Kombinationen aus GPU-Typ, Anzahl der GPUs und Maschinentyp (vCPUs und Arbeitsspeicher)) und ihre Anwendungsfälle sind auf der Seite GPU-Maschinentypen in der Compute Engine-Dokumentation aufgeführt.
Die für einen Job erforderlichen Felder zur Angabe eines GPU-Maschinentyps variieren je nach Kategorie in der folgenden Tabelle:
GPU-Maschinentypen und ihre Jobanforderungen | |
---|---|
GPUs für beschleunigungsoptimierte VMs: VMs mit einem Maschinentyp aus der beschleunigungsoptimierten Maschinenfamilie sind automatisch mit einem bestimmten Typ und einer bestimmten Anzahl dieser GPUs verbunden. |
Wenn Sie GPUs für beschleunigungsoptimierte VMs verwenden möchten, empfehlen wir Ihnen, den Maschinentyp anzugeben. Jeder beschleunigungsoptimierte Maschinentyp unterstützt nur einen bestimmten Typ und eine bestimmte Anzahl von GPUs. Daher ist es funktional gleichgültig, ob Sie diese Werte zusätzlich zum beschleunigungsoptimierten Maschinentyp angeben oder nicht. Insbesondere unterstützt Batch auch die Angabe von nur Typ und Anzahl der GPUs für beschleunigungsoptimierte VMs. Die daraus resultierenden vCPU- und Arbeitsspeicheroptionen sind jedoch oft sehr begrenzt. Wir empfehlen daher, zu prüfen, ob die verfügbaren vCPU- und Speicheroptionen mit den Anforderungen der Aufgabe kompatibel sind. |
GPUs für N1-VMs: Bei diesen GPUs müssen Sie den Typ und die Anzahl angeben, die an jede VM angehängt werden soll. Sie müssen an VMs mit einem Maschinentyp aus der N1-Maschinenreihe angehängt werden. |
Wenn Sie GPUs für N1-VMs verwenden möchten, sollten Sie mindestens den GPU-Typ und die Anzahl der GPUs angeben. Die Kombination der Werte muss mit einer der gültigen GPU-Optionen für die N1-Maschinentypen übereinstimmen. Die vCPU- und Arbeitsspeicheroptionen für N1-VMs mit einem bestimmten GPU-Typ und einer bestimmten GPU-Anzahl sind recht flexibel. Sofern Sie den Job nicht mit der Google Cloud Console erstellen, können Sie Batch automatisch einen Maschinentyp auswählen lassen, der die Aufgabenanforderungen des Jobs erfüllt. |
Bereitstellungsmethode auswählen
Batch verwendet je nach Art der angeforderten Ressourcen unterschiedliche Methoden, um die VM-Ressourcen für Jobs bereitzustellen, die GPUs verwenden. Die verfügbaren Bereitstellungsmethoden und ihre Anforderungen werden in der folgenden Tabelle erläutert. Sie sind nach Anwendungsfall aufgelistet, von der höchsten bis zur niedrigsten Ressourcenverfügbarkeit.
Zusammenfassend empfehlen wir den meisten Nutzern Folgendes:
Wenn Sie A3-GPU-Maschinentypen ohne Reservierung verwenden möchten, verwenden Sie den Dynamic Workload Scheduler für Batch (Vorabversion).
Verwenden Sie für alle anderen GPU-Maschinentypen die Standardbereitstellungsmethode. Die Standardbereitstellungsmethode ist in der Regel „On-Demand“. Eine Ausnahme besteht, wenn Ihr Projekt nicht verwendete Reservierungen enthält, die der Job automatisch nutzen kann.
Bereitstellungsmethoden und ihre Jobanforderungen | |
---|---|
Reservierungen
|
Batch verwendet Reservierungen für Jobs, die nicht verwendete Reservierungen verbrauchen können. Weitere Informationen zu Reservierungen und ihren Anforderungen finden Sie auf der Seite Ressourcenverfügbarkeit mit VM-Reservierungen gewährleisten. |
Dynamischer Arbeitslastplaner für Batch-Jobs (Vorabversion)
|
Der Dynamic Workload Scheduler wird in Batch für Jobs verwendet, die folgende Eigenschaften haben:
|
On demand
|
Batch verwendet On-Demand für alle anderen Jobs. |
Spot-VMs
|
Batch verwendet Spot-VMs für Jobs, bei denen das Feld |
Schritt 2: GPU-Treiber installieren
Wenn Sie GPUs für einen Job verwenden möchten, müssen Sie die GPU-Treiber installieren. Sie haben folgende Möglichkeiten, GPU-Treiber zu installieren:
GPU-Treiber automatisch installieren (nach Möglichkeit empfohlen): Wie in den Beispielen gezeigt, können Sie das Feld
installGpuDrivers
für den Job auftrue
festlegen, damit Batch die erforderlichen GPU-Treiber von einem Drittanbieter-Speicherort abholt und in Ihrem Namen installiert. Diese Methode wird empfohlen, wenn Sie bei Ihrer Arbeit keine Treiber manuell installieren müssen.Optional: Wenn Sie angeben möchten, welche Version des GPU-Treibers mit dem Batch installiert werden soll, legen Sie auch das Feld
driverVersion
fest.GPU-Treiber manuell installieren:Diese Methode ist erforderlich, wenn eine der folgenden Bedingungen erfüllt ist:
- Ein Job verwendet sowohl Script- als auch Container-Ausführbare und hat keinen Internetzugang. Weitere Informationen zum Zugriff eines Jobs finden Sie unter Netzwerkkonfiguration für Batch-Jobs.
- Ein Job verwendet ein benutzerdefiniertes VM-Image. Weitere Informationen zu VM-Betriebssystem-Images und zu den VM-Betriebssystem-Images, die Sie verwenden können, finden Sie unter VM-Betriebssystemumgebung – Übersicht.
Für die manuelle Installation der erforderlichen GPU-Treiber wird die folgende Methode empfohlen:
Erstellen Sie ein benutzerdefiniertes VM-Image, das die GPU-Treiber enthält.
Führen Sie zum Installieren von GPU-Treibern ein Installationsskript für das gewünschte Betriebssystem aus:
Wenn Ihr Job Container-Ausführprogramme enthält und nicht Container-Optimized OS verwendet, müssen Sie auch das NVIDIA Container Toolkit installieren.
Wenn Sie einen Job erstellen und einreichen, der GPUs verwendet, geben Sie das benutzerdefinierte VM-Image an, das die GPU-Treiber enthält, und legen Sie das Feld
installGpuDrivers
für den Job auffalse
(Standard) fest.
Schritt 3: Kompatible VM-Ressourcen definieren
Informationen zu den Anforderungen und Optionen für die Definition der VM-Ressourcen für einen Job finden Sie unter Jobressourcen.
Zusammenfassend müssen Sie beim Definieren der VM-Ressourcen für einen Job, der GPUs verwendet, Folgendes tun:
Achten Sie darauf, dass der GPU-Maschinentyp am Speicherort der VMs Ihres Jobs verfügbar ist.
Informationen dazu, wo GPU-Maschinentypen verfügbar sind, finden Sie in der Compute Engine-Dokumentation unter GPU-Verfügbarkeit nach Regionen und Zonen.
Wenn Sie den Maschinentyp des Jobs angeben, muss dieser genügend vCPUs und Arbeitsspeicher für die Aufgabenanforderungen des Jobs haben. Die Angabe des Maschinentyps des Jobs ist erforderlich, wenn Sie einen Job in der Google Cloud -Konsole erstellen. Sie wird empfohlen, wenn Sie einen Job erstellen, der GPUs für acceleratoroptimierte VMs verwendet.
Achten Sie darauf, die VM-Ressourcen für einen Job mit einer gültigen Methode zu definieren:
- Definieren Sie VM-Ressourcen direkt mithilfe des Felds
instances[].policy
(nach Möglichkeit empfohlen). Diese Methode wird in den Beispielen veranschaulicht. - Definieren Sie VM-Ressourcen über eine Vorlage mithilfe des Felds
instances[].instanceTemplate
. Diese Methode ist erforderlich, um GPU-Treiber manuell über ein benutzerdefiniertes Image zu installieren. Weitere Informationen finden Sie unter Jobressourcen mit einer VM-Instanzvorlage definieren.
- Definieren Sie VM-Ressourcen direkt mithilfe des Felds
Beispieljob erstellen, der GPUs verwendet
In den folgenden Abschnitten wird beschrieben, wie Sie mit den empfohlenen Optionen einen Beispieljob für jeden GPU-Maschinentyp erstellen. Bei den Beispieljobs werden GPU-Treiber automatisch installiert, VM-Ressourcen direkt definiert und entweder die Bereitstellungsmethode angegeben oder die Standardbereitstellungsmethode verwendet.
- GPUs für A3-VMs über Dynamic Workload Scheduler verwenden (Vorabversion)
- GPUs für beschleunigungsoptimierte VMs verwenden
- GPUs für N1-VMs verwenden
GPUs für A3-VMs über Dynamic Workload Scheduler for Batch (Vorabversion) verwenden
Sie können einen Job erstellen, der GPUs für A3-VMs über Dynamic Workload Scheduler mit der gcloud CLI oder der Batch API verwendet.
gcloud
Erstellen Sie eine JSON-Datei, die GPU-Treiber installiert, einen Maschinentyp aus der A3-Maschinenreihe angibt, Reservierungen blockiert und an einem Speicherort ausgeführt wird, der den GPU-Maschinentyp hat.
Wenn Sie beispielsweise einen einfachen Script-Job erstellen möchten, der GPUs für A3-VMs über den Dynamic Workload Scheduler verwendet, erstellen Sie eine JSON-Datei mit dem folgenden Inhalt:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "machineType": "MACHINE_TYPE", "reservation": "NO_RESERVATION" } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Ersetzen Sie Folgendes:
INSTALL_GPU_DRIVERS
: Wenn diese Option auftrue
festgelegt ist, ruft Batch die für den GPU-Typ erforderlichen Treiber ab, den Sie im Feldpolicy
angeben, von einem Drittanbieter ab und installiert sie in Ihrem Namen. Wenn Sie dieses Feld auffalse
(Standardeinstellung) festlegen, müssen Sie GPU-Treiber manuell installieren, um GPUs für diesen Job zu verwenden.MACHINE_TYPE
: ein Maschinentyp aus der A3-Maschinenserie.ALLOWED_LOCATIONS
: Optional können Sie das FeldallowedLocations[]
verwenden, um eine Region oder bestimmte Zonen in einer Region anzugeben, in der die VMs für Ihren Job ausgeführt werden dürfen. Mitregions/us-central1
sind beispielsweise alle Zonen in der Regionus-central1
zulässig. Geben Sie Standorte an, an denen der für diesen Job erforderliche GPU-Maschinentyp verfügbar ist. Wenn Sie dieses Feld weglassen, muss der GPU-Maschinentyp am Standort des Jobs verfügbar sein.
Verwenden Sie den Befehl
gcloud batch jobs submit
, um den Job zu erstellen und auszuführen:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Ersetzen Sie Folgendes:
JOB_NAME
: Der Name des Jobs.LOCATION
: den Standort der Stelle.JSON_CONFIGURATION_FILE
: der Pfad zu einer JSON-Datei mit den Konfigurationsdetails des Jobs.
API
Stellen Sie eine POST
-Anfrage an die jobs.create
-Methode, die GPU-Treiber installiert, einen Maschinentyp aus der A3-Maschinenreihe angibt, Reservierungen blockiert und an einem Ort ausgeführt wird, an dem sich der GPU-Maschinentyp befindet.
Wenn Sie beispielsweise einen einfachen Script-Job erstellen möchten, der GPUs für A3-VMs über Dynamic Workload Scheduler verwendet, senden Sie die folgende Anfrage:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"machineType": "MACHINE_TYPE",
"reservation": "NO_RESERVATION"
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: den Standort der Stelle.JOB_NAME
: Der Name des Jobs.INSTALL_GPU_DRIVERS
: Wenn diese Option auftrue
festgelegt ist, ruft Batch die für den GPU-Typ erforderlichen Treiber ab, den Sie im Feldpolicy
angeben, von einem Drittanbieter ab und installiert sie in Ihrem Namen. Wenn Sie dieses Feld auffalse
(Standardeinstellung) festlegen, müssen Sie GPU-Treiber manuell installieren, um GPUs für diesen Job zu verwenden.MACHINE_TYPE
: ein Maschinentyp aus der A3-Maschinenserie.ALLOWED_LOCATIONS
: Optional können Sie das FeldallowedLocations[]
verwenden, um eine Region oder bestimmte Zonen in einer Region anzugeben, in denen die VMs für Ihren Job ausgeführt werden dürfen. Mitregions/us-central1
sind beispielsweise alle Zonen in der Regionus-central1
zulässig. Geben Sie Standorte an, an denen der für diesen Job erforderliche GPU-Maschinentyp verfügbar ist. Wenn Sie dieses Feld weglassen, achten Sie darauf, dass der GPU-Maschinentyp am Standort des Jobs verfügbar ist.
GPUs für beschleunigungsoptimierte VMs verwenden
Sie können einen Job erstellen, der GPUs für beschleunigeroptimierte VMs verwendet. Dazu können Sie dieGoogle Cloud -Console, die gcloud CLI, die Batch API, Java, Node.js oder Python verwenden.
Console
So erstellen Sie mit der Google Cloud -Console einen Job, der GPUs verwendet:
Rufen Sie in der Google Cloud -Console die Seite Jobliste auf.
Klicken Sie auf
Erstellen. Die Seite Batchjob erstellen wird geöffnet. Im linken Bereich ist die Seite Jobdetails ausgewählt.Konfigurieren Sie die Seite Jobdetails:
Optional: Passen Sie im Feld Jobname den Jobnamen an.
Geben Sie beispielsweise
example-gpu-job
ein.Konfigurieren Sie den Abschnitt Aufgabendetails:
Fügen Sie im Fenster Neues Runnable mindestens ein Script oder einen Container hinzu, das bzw. den dieser Job ausführen soll.
So erstellen Sie beispielsweise einen einfachen Scriptjob:
Klicken Sie das Kästchen Script an. Ein Feld wird angezeigt.
Geben Sie im Feld das folgende Script ein:
echo Hello world from task ${BATCH_TASK_INDEX}.
Klicken Sie auf Fertig.
Geben Sie im Feld Task count (Aufgabenanzahl) die Anzahl der Aufgaben für diesen Job ein.
Geben Sie beispielsweise
3
ein.Optional: Geben Sie im Feld Parallelität die Anzahl der Aufgaben ein, die gleichzeitig ausgeführt werden sollen.
Geben Sie beispielsweise
1
(Standardeinstellung) ein.
Konfigurieren Sie die Seite Ressourcenspezifikationen:
Klicken Sie im linken Bereich auf Ressourcenangaben. Die Seite Ressourcenangaben wird geöffnet.
Optional: Wählen Sie im Abschnitt VM-Bereitstellungsmodell eine der folgenden Optionen für das Bereitstellungsmodell für die VMs dieses Jobs aus:
Wenn Ihr Job eine vorzeitige Beendigung verkraften kann und Sie vergünstigte VMs benötigen, wählen Sie Spot aus.
Wählen Sie andernfalls Standard (Standardeinstellung) aus.
Wählen Sie den Standort für diese Stelle aus.
Wählen Sie im Feld Region eine Region aus.
Führen Sie im Feld Zone einen der folgenden Schritte aus:
Wenn Sie diesen Job nur in einer bestimmten Zone ausführen lassen möchten, wählen Sie eine Zone aus.
Wählen Sie andernfalls beliebig (Standardeinstellung) aus.
Wählen Sie den GPU-Maschinentyp für die VMs dieses Jobs aus:
Klicken Sie in den Optionen für die Maschinenfamilie auf GPUs.
Wählen Sie im Feld GPU-Typ den GPU-Typ aus. Wählen Sie dann im Feld Anzahl der GPUs die Anzahl der GPUs für jede VM aus.
Wenn Sie einen der GPU-Typen für beschleunigungsoptimierte VMs ausgewählt haben, ist im Feld Maschinentyp nur eine Option für den Maschinentyp verfügbar, die auf dem Typ und der Anzahl der ausgewählten GPUs basiert.
Wenn Sie GPU-Treiber automatisch installieren möchten, wählen Sie GPU-Treiberinstallation (Standardeinstellung) aus.
Konfigurieren Sie die Menge der für jede Aufgabe erforderlichen VM-Ressourcen:
Geben Sie im Feld Kerne die Anzahl der vCPUs pro Aufgabe ein.
Geben Sie beispielsweise
1
(Standardeinstellung) ein.Geben Sie im Feld Speicher die Größe des RAM in GB pro Aufgabe ein.
Geben Sie beispielsweise
0.5
(Standardeinstellung) ein.
Klicken Sie auf Fertig.
Optional: Konfigurieren Sie die anderen Felder für diesen Job.
Optional: Wenn Sie die Jobkonfiguration überprüfen möchten, klicken Sie im linken Bereich auf Vorschau.
Klicken Sie auf Erstellen.
Auf der Seite Jobdetails wird der von Ihnen erstellte Job angezeigt.
gcloud
Erstellen Sie eine JSON-Datei, die GPU-Treiber installiert, einen Maschinentyp aus der beschleunigungsoptimierten Maschinenfamilie angibt und an einem Speicherort ausgeführt wird, der den GPU-Maschinentyp hat.
Wenn Sie beispielsweise einen einfachen Script-Job erstellen möchten, der GPUs für accelerator-optimierte VMs verwendet, erstellen Sie eine JSON-Datei mit dem folgenden Inhalt:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "machineType": "MACHINE_TYPE" } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Ersetzen Sie Folgendes:
INSTALL_GPU_DRIVERS
: Wenn diese Option auftrue
festgelegt ist, ruft Batch die für den GPU-Typ erforderlichen Treiber ab, den Sie im Feldpolicy
angeben, von einem Drittanbieter-Speicherort ab und installiert sie in Ihrem Namen. Wenn Sie dieses Feld auffalse
(Standardeinstellung) festlegen, müssen Sie GPU-Treiber manuell installieren, um GPUs für diesen Job zu verwenden.MACHINE_TYPE
: ein Maschinentyp aus der Beschleunigungsoptimierten Maschinenfamilie.ALLOWED_LOCATIONS
: Optional können Sie das FeldallowedLocations[]
verwenden, um eine Region oder bestimmte Zonen in einer Region anzugeben, in denen die VMs für Ihren Job ausgeführt werden dürfen. Mitregions/us-central1
sind beispielsweise alle Zonen in der Regionus-central1
zulässig. Geben Sie Standorte an, an denen der für diesen Job erforderliche GPU-Maschinentyp verfügbar ist. Wenn Sie dieses Feld weglassen, achten Sie darauf, dass der GPU-Maschinentyp am Standort des Jobs verfügbar ist.
Verwenden Sie den Befehl
gcloud batch jobs submit
, um den Job zu erstellen und auszuführen:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Ersetzen Sie Folgendes:
JOB_NAME
: Der Name des Jobs.LOCATION
: den Standort der Stelle.JSON_CONFIGURATION_FILE
: der Pfad zu einer JSON-Datei mit den Konfigurationsdetails des Jobs.
API
Stellen Sie eine POST
-Anfrage an die Methode jobs.create
, die GPU-Treiber installiert, einen Maschinentyp aus der beschleunigungsoptimierten Maschinenfamilie angibt und an einem Ort ausgeführt wird, an dem der GPU-Maschinentyp vorhanden ist.
Wenn Sie beispielsweise einen einfachen Script-Job erstellen möchten, der GPUs für accelerator-optimierte VMs verwendet, stellen Sie folgende Anfrage:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"machineType": "MACHINE_TYPE"
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: den Standort der Stelle.JOB_NAME
: Der Name des Jobs.INSTALL_GPU_DRIVERS
: Wenn diese Option auftrue
festgelegt ist, ruft Batch die für den GPU-Typ erforderlichen Treiber ab, den Sie im Feldpolicy
angeben, von einem Drittanbieter-Speicherort ab und installiert sie in Ihrem Namen. Wenn Sie dieses Feld auffalse
(Standardeinstellung) festlegen, müssen Sie GPU-Treiber manuell installieren, um GPUs für diesen Job zu verwenden.MACHINE_TYPE
: ein Maschinentyp aus der Beschleunigungsoptimierten Maschinenfamilie.ALLOWED_LOCATIONS
: Optional können Sie das FeldallowedLocations[]
verwenden, um eine Region oder bestimmte Zonen in einer Region anzugeben, in der die VMs für Ihren Job ausgeführt werden dürfen. Mitregions/us-central1
sind beispielsweise alle Zonen in der Regionus-central1
zulässig. Geben Sie Standorte an, an denen der für diesen Job erforderliche GPU-Maschinentyp verfügbar ist. Wenn Sie dieses Feld weglassen, achten Sie darauf, dass der GPU-Maschinentyp am Standort des Jobs verfügbar ist.
Java
Node.js
Python
GPUs für N1-VMs verwenden
Sie können einen Job erstellen, der GPUs für N1-VMs verwendet, mit der Google Cloud -Konsole, der gcloud CLI, der Batch API, Java, Node.js oder Python.
Console
So erstellen Sie mit der Google Cloud -Console einen Job, der GPUs verwendet:
Rufen Sie in der Google Cloud -Console die Seite Jobliste auf.
Klicken Sie auf
Erstellen. Die Seite Batchjob erstellen wird geöffnet. Im linken Bereich ist die Seite Jobdetails ausgewählt.Konfigurieren Sie die Seite Jobdetails:
Optional: Passen Sie im Feld Jobname den Jobnamen an.
Geben Sie beispielsweise
example-gpu-job
ein.Konfigurieren Sie den Abschnitt Aufgabendetails:
Fügen Sie im Fenster Neues Runnable mindestens ein Script oder einen Container hinzu, das bzw. den dieser Job ausführen soll.
So erstellen Sie beispielsweise einen einfachen Scriptjob:
Klicken Sie das Kästchen Script an. Ein Feld wird angezeigt.
Geben Sie im Feld das folgende Script ein:
echo Hello world from task ${BATCH_TASK_INDEX}.
Klicken Sie auf Fertig.
Geben Sie im Feld Task count (Aufgabenanzahl) die Anzahl der Aufgaben für diesen Job ein.
Geben Sie beispielsweise
3
ein.Optional: Geben Sie im Feld Parallelität die Anzahl der Aufgaben ein, die gleichzeitig ausgeführt werden sollen.
Geben Sie beispielsweise
1
(Standardeinstellung) ein.
Konfigurieren Sie die Seite Ressourcenspezifikationen:
Klicken Sie im linken Bereich auf Ressourcenanforderungen. Die Seite Ressourcenangaben wird geöffnet.
Optional: Wählen Sie im Abschnitt VM-Bereitstellungsmodell eine der folgenden Optionen für das Bereitstellungsmodell für die VMs dieses Jobs aus:
Wenn Ihr Job eine vorzeitige Beendigung verkraften kann und Sie vergünstigte VMs benötigen, wählen Sie Spot aus.
Wählen Sie andernfalls Standard (Standardeinstellung) aus.
Wählen Sie den Standort für diese Stelle aus.
Wählen Sie im Feld Region eine Region aus.
Führen Sie im Feld Zone einen der folgenden Schritte aus:
Wenn Sie diesen Job nur in einer bestimmten Zone ausführen lassen möchten, wählen Sie eine Zone aus.
Wählen Sie andernfalls beliebig (Standardeinstellung) aus.
Wählen Sie den GPU-Maschinentyp für die VMs dieses Jobs aus:
Klicken Sie in den Optionen für die Maschinenfamilie auf GPUs.
Wählen Sie im Feld GPU-Typ den GPU-Typ aus.
Wenn Sie einen der GPU-Typen für N1-VMs ausgewählt haben, ist das Feld Reihe auf N1 festgelegt.
Wählen Sie im Feld Anzahl der GPUs die Anzahl der GPUs für jede VM aus.
Wählen Sie im Feld Maschinentyp den Maschinentyp aus.
Wenn Sie GPU-Treiber automatisch installieren möchten, wählen Sie GPU-Treiberinstallation (Standardeinstellung) aus.
Konfigurieren Sie die Menge der für jede Aufgabe erforderlichen VM-Ressourcen:
Geben Sie im Feld Kerne die Anzahl der vCPUs pro Aufgabe ein.
Geben Sie beispielsweise
1
(Standardeinstellung) ein.Geben Sie im Feld Speicher die Größe des RAM in GB pro Aufgabe ein.
Geben Sie beispielsweise
0.5
(Standardeinstellung) ein.
Klicken Sie auf Fertig.
Optional: Konfigurieren Sie die anderen Felder für diesen Job.
Optional: Wenn Sie die Jobkonfiguration überprüfen möchten, klicken Sie im linken Bereich auf Vorschau.
Klicken Sie auf Erstellen.
Auf der Seite Jobdetails wird der von Ihnen erstellte Job angezeigt.
gcloud
Erstellen Sie eine JSON-Datei, die GPU-Treiber installiert, die Unterfelder
type
undcount
des Feldsaccelerators[]
definiert und an einem Speicherort ausgeführt wird, der den GPU-Maschinentyp hat.Wenn Sie beispielsweise einen einfachen Script-Job erstellen möchten, der GPUs für N1-VMs verwendet und Batch den genauen N1-Maschinentyp auswählen lässt, erstellen Sie eine JSON-Datei mit folgendem Inhalt:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "accelerators": [ { "type": "GPU_TYPE", "count": GPU_COUNT } ] } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Ersetzen Sie Folgendes:
INSTALL_GPU_DRIVERS
: Wenn diese Option auftrue
festgelegt ist, ruft Batch die für den GPU-Typ erforderlichen Treiber ab, den Sie im Feldpolicy
angeben, von einem Drittanbieter ab und installiert sie in Ihrem Namen. Wenn Sie dieses Feld auffalse
(Standardeinstellung) festlegen, müssen Sie GPU-Treiber manuell installieren, um GPUs für diesen Job zu verwenden.GPU_TYPE
: GPU-Typ Mit dem Befehlgcloud compute accelerator-types list
können Sie eine Liste der verfügbaren GPU-Typen aufrufen. Verwenden Sie dieses Feld nur für GPUs für N1-VMs.GPU_COUNT
: die Anzahl der GPUs des angegebenen Typs. Weitere Informationen zu den zulässigen Optionen finden Sie unter GPU-Maschinentypen für die N1-Maschinenserie. Verwenden Sie dieses Feld nur für GPUs für N1-VMs.ALLOWED_LOCATIONS
: Optional können Sie das FeldallowedLocations[]
verwenden, um eine Region oder bestimmte Zonen in einer Region anzugeben, in der die VMs für Ihren Job ausgeführt werden dürfen. Mitregions/us-central1
sind beispielsweise alle Zonen in der Regionus-central1
zulässig. Geben Sie Standorte an, an denen der für diesen Job erforderliche GPU-Maschinentyp verfügbar ist. Wenn Sie dieses Feld weglassen, achten Sie darauf, dass der GPU-Maschinentyp am Standort des Jobs verfügbar ist.
Verwenden Sie den Befehl
gcloud batch jobs submit
, um den Job zu erstellen und auszuführen:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Ersetzen Sie Folgendes:
JOB_NAME
: Der Name des Jobs.LOCATION
: den Standort der Stelle.JSON_CONFIGURATION_FILE
: der Pfad zu einer JSON-Datei mit den Konfigurationsdetails des Jobs.
API
Stellen Sie eine POST
-Anfrage an die jobs.create
-Methode, die GPU-Treiber installiert, die Unterfelder type
und count
des Felds accelerators[]
definiert und einen Speicherort mit dem GPU-Maschinentyp verwendet.
Wenn Sie beispielsweise einen einfachen Script-Job erstellen möchten, der GPUs für N1-VMs verwendet und Batch den genauen N1-Maschinentyp auswählen lässt, stellen Sie folgende Anfrage:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"accelerators": [
{
"type": "GPU_TYPE",
"count": GPU_COUNT
}
]
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: den Standort der Stelle.JOB_NAME
: Der Name des Jobs.INSTALL_GPU_DRIVERS
: Wenn diese Option auftrue
festgelegt ist, ruft Batch die für den GPU-Typ erforderlichen Treiber ab, den Sie im Feldpolicy
angeben, von einem Drittanbieter ab und installiert sie in Ihrem Namen. Wenn Sie dieses Feld auffalse
(Standardeinstellung) festlegen, müssen Sie GPU-Treiber manuell installieren, um GPUs für diesen Job zu verwenden.GPU_TYPE
: GPU-Typ Mit dem Befehlgcloud compute accelerator-types list
können Sie eine Liste der verfügbaren GPU-Typen aufrufen. Verwenden Sie dieses Feld nur für GPUs für N1-VMs.GPU_COUNT
: die Anzahl der GPUs des angegebenen Typs. Weitere Informationen zu den zulässigen Optionen finden Sie unter GPU-Maschinentypen für die N1-Maschinenserie. Verwenden Sie dieses Feld nur für GPUs für N1-VMs.ALLOWED_LOCATIONS
: Optional können Sie das FeldallowedLocations[]
verwenden, um eine Region oder bestimmte Zonen in einer Region anzugeben, in denen die VMs für Ihren Job ausgeführt werden dürfen. Mitregions/us-central1
sind beispielsweise alle Zonen in der Regionus-central1
zulässig. Geben Sie Standorte an, an denen der für diesen Job erforderliche GPU-Maschinentyp verfügbar ist. Wenn Sie dieses Feld weglassen, muss der GPU-Maschinentyp am Standort des Jobs verfügbar sein.
Java
Node.js
Python
Nächste Schritte
- Wenn beim Erstellen oder Ausführen eines Jobs Probleme auftreten, lesen Sie den Hilfeartikel Fehlerbehebung.
- Aufgaben und Jobs ansehen
- Weitere Informationen zu Optionen zum Erstellen von Jobs