Passend zum Framework und Prozessor Ihrer Wahl sind verschiedene spezifische Deep Learning-VM-Images verfügbar. Aktuell gibt es Images, die TensorFlow, PyTorch und generisches Hochleistungs-Computing unterstützen. Einige Versionen unterstützen sowohl ausschließlich CPU-basierte als auch GPU-fähige Workflows. Informationen dazu, wie Sie das gewünschte Image finden, enthält die unten stehende Tabelle.
Imagefamilie auswählen
Für welche Deep Learning-VM-Imagefamilie Sie sich entscheiden, hängt von Ihren Anforderungen ab. In der folgenden Tabelle sind die neuesten Versionen von Imagefamilien nach dem Framework-Typ geordnet aufgeführt.
Wenn Sie eine Instanz dadurch erstellen, dass Sie auf eine Imagefamilie mit latest
im Namen verweisen, achten Sie darauf, dass Sie immer die neueste Version dieses Images erhalten.
Wenn Sie eine bestimmte Framework-Version benötigen, fahren Sie mit Alle verfügbaren Versionen auflisten fort.
Framework | Prozessor | Image-Familienname(n) |
---|---|---|
Basis | GPU | common-cu110 common-cu101 common-cu100 common-cu92 common-cu91 common-cu90
|
CPU | common-cpu |
|
TensorFlow Enterprise 2.x | GPU | tf2-ent-latest-gpu |
CPU | tf2-ent-latest-cpu |
|
TensorFlow Enterprise 1.x | GPU | tf-ent-latest-gpu |
CPU | tf-ent-latest-cpu |
|
TensorFlow 2.x | GPU | tf2-2-4-cu110
|
CPU | tf2-2-4-cpu |
|
TensorFlow 1.x | GPU | tf-latest-gpu |
CPU | tf-latest-cpu |
|
PyTorch | GPU | pytorch-latest-gpu |
CPU | pytorch-latest-cpu | |
PyTorch XLA | TPU/GPU/CPU (experimentell) | pytorch-latest-xla |
R | CPU (experimentell) | r-latest-cpu-experimental |
RAPIDS | GPU (experimentell) | rapids-latest-gpu-experimental |
Chainer | GPU (experimentell) | chainer-latest-gpu-experimental |
CPU (experimentell) | chainer-latest-cpu-experimental | |
XGBoost | GPU (experimentell) | xgboost-latest-gpu-experimental |
CPU (experimentell) | xgboost-latest-cpu-experimental | |
MXNet | GPU (experimentell) | mxnet-latest-gpu-experimental |
CPU (experimentell) | mxnet-latest-cpu-experimental |
|
CNTK | GPU (experimentell) | cntk-latest-gpu-experimental |
CPU (experimentell) | cntk-latest-cpu-experimental |
|
Caffe | GPU (experimentell) | caffe1-latest-gpu-experimental |
CPU (experimentell) | caffe1-latest-cpu-experimental |
Betriebssystem auswählen
Für die meisten Frameworks ist Debian 10 das Standardbetriebssystem. Debian 9- und Ubuntu 18.04-Images sind für einige Frameworks verfügbar. Sie sind durch die Suffixe -debian-9
und -ubuntu-1804
im Namen der Imagefamilie gekennzeichnet (siehe Alle verfügbaren Versionen auflisten). Für die folgenden Frameworks ist Debian 9 die Standardeinstellung. Sie sind für Debian 10 nicht verfügbar.
- Chainer
- Rapids
- Cafaff mit GPU
PyTorch 1.6 Cuda 11 (pytorch-1-6-cu110
und alle TensorFlow Enterprise-Imagefamilien (tf-ent
und tf2-ent
) unterstützen A100-GPU-Beschleuniger.
TensorFlow Enterprise-Images
TensorFlow Enterprise-Imagefamilien bieten Ihnen eine für Google Cloud optimierte Distribution von TensorFlow mit langfristiger Versionsunterstützung. Weitere Informationen zu TensorFlow Enterprise finden Sie in der TensorFlow Enterprise-Übersicht.
Die folgende Tabelle der verfügbaren TensorFlow-Images unterstützt Sie bei der Auswahl des Images mit der gewünschten TensorFlow- oder TensorFlow Enterprise-Version.
Version von TensorFlow oder TensorFlow Enterprise | Prozessor | Image-Familienname |
---|---|---|
TensorFlow 2.4 | GPU | tf2-2-4-cu110
|
CPU | tf2-2-4-cpu |
|
TensorFlow Enterprise 2.3 | GPU | tf2-2-3-cu110
|
CPU | tf2-2-3-cpu |
|
TensorFlow 2.2 | GPU | tf2-2-2-cu101
|
CPU | tf2-2-2-cpu
|
|
TensorFlow Enterprise 2.1 | GPU | tf2-2-1-cu110
|
CPU | tf2-2-1-cpu |
|
TensorFlow 2.0 | GPU | tf2-2-0-cu100
|
CPU | tf2-2-0-cpu |
|
TensorFlow Enterprise 1.15 | GPU | tf-1-15-cu110
|
CPU | tf-1-15-cpu |
|
TensorFlow 1.14 | GPU | tf-1-14-cu100
|
CPU | tf-1-14-cpu |
|
TensorFlow 1.13 | GPU | tf-1-13-cu100
|
CPU | tf-1-13-cpu |
|
TensorFlow 1.11 | GPU | tf-1-11-cu100
|
CPU | tf-1-11-cpu |
|
TensorFlow 1.10 | GPU | tf-1-10-cu100
|
CPU | tf-1-10-cpu |
Experimentelle Images
Einige Deep Learning-VM-Imagefamilien sind experimentell, wie in der Tabelle der Imagefamilien angegeben. Experimentelle Images werden auf Best-Effort-Basis unterstützt und werden nicht bei jedem neuen Release des Frameworks automatisch aktualisiert.
Imageversion angeben
Images können wiederverwendet werden, auch wenn es bereits eine neuere Version des Image gibt. Dies kann z. B. sinnvoll sein, wenn Sie einen Cluster erstellen und dabei sicher sein möchten, dass neue Instanzen immer mit denselben Images erstellt werden. In diesem Fall sollte nicht der Name der Imagefamilie angegeben werden. Sonst kann es passieren, dass einige Instanzen des Clusters nach der Aktualisierung des neuesten Image unterschiedliche Images haben.
Ermitteln Sie stattdessen den genauen Namen des Image, fügen Sie die Versionsnummer ein und erstellen Sie neue Instanzen im Cluster mit diesem spezifischen Image.
Verwenden Sie den folgenden Befehl im gcloud
-Befehlszeilentool mit Ihrem bevorzugten Terminal oder in Cloud Shell, um den genauen Namen des neuesten Images festzustellen. Ersetzen Sie image-family durch den Namen der Image-Familie, für die Sie die neueste Versionsnummer ermitteln möchten.
gcloud compute images describe-from-family image-family \ --project deeplearning-platform-release
Suchen Sie in der Ausgabe nach dem Feld name
und verwenden Sie den dort angegebenen Imagenamen beim Erstellen neuer Instanzen.
Alle verfügbaren Versionen auflisten
Wenn Sie ein bestimmtes Framework oder eine bestimmte CUDA-Version benötigen, können Sie in der vollständigen Liste der verfügbaren Images danach suchen. Verwenden Sie den folgenden Befehl des gcloud
-Tools, um alle verfügbaren Deep Learning-VM-Images aufzulisten.
gcloud compute images list \ --project deeplearning-platform-release \ --no-standard-images
Imagefamilien haben das Format FRAMEWORK-VERSION-CUDA_VERSION(-experimental)
, wobei FRAMEWORK
die Zielbibliothek, VERSION
die Framework-Version und CUDA_VERSION
die Version des CUDA-Stacks ist, falls vorhanden.
So verwendet beispielsweise ein Image aus der Familie tf2-ent-2-3-cu110
das Framework TensorFlow 2.3 sowie CUDA 11.0. Ein Image aus der Familie pytorch-1-7-cpu
nutzt das Framework PyTorch 1.7 und keinen CUDA-Stack.
Nächste Schritte
Erstellen einer neuen Deep Learning-VM-Instanz über den Cloud Marketplace oder über die Befehlszeile.