Image auswählen

Passend zum Framework und Prozessor Ihrer Wahl sind verschiedene spezifische Deep Learning-VM-Images verfügbar. Aktuell gibt es Images, die TensorFlow, PyTorch und generisches Hochleistungs-Computing unterstützen. Einige Versionen unterstützen sowohl ausschließlich CPU-basierte als auch GPU-fähige Workflows. Informationen dazu, wie Sie das gewünschte Image finden, enthält die unten stehende Tabelle.

Imagefamilie auswählen

Für welche Deep Learning-VM-Imagefamilie Sie sich entscheiden, hängt von Ihren Anforderungen ab. In der folgenden Tabelle sind die neuesten Versionen von Imagefamilien nach dem Framework-Typ geordnet aufgeführt. Wenn Sie eine Instanz dadurch erstellen, dass Sie auf eine Imagefamilie mit latest im Namen verweisen, achten Sie darauf, dass Sie immer die neueste Version dieses Images erhalten. Wenn Sie eine bestimmte Framework-Version benötigen, fahren Sie mit Alle verfügbaren Versionen auflisten fort.

Framework Prozessor Image-Familienname(n)
Basis GPU common-cu110
common-cu101
common-cu100
CPU common-cpu
TensorFlow Enterprise 2.x GPU tf2-ent-latest-gpu
CPU tf2-ent-latest-cpu
TensorFlow Enterprise 1.x GPU tf-ent-latest-gpu
CPU tf-ent-latest-cpu
PyTorch GPU pytorch-latest-gpu
CPU pytorch-latest-cpu
PyTorch XLA TPU/GPU/CPU (experimentell) pytorch-latest-xla
R CPU (experimentell) r-latest-cpu-experimental
RAPIDS GPU (experimentell) rapids-latest-gpu-experimental
Chainer GPU (experimentell) chainer-latest-gpu-experimental
CPU (experimentell) chainer-latest-cpu-experimental
XGBoost GPU (experimentell) xgboost-latest-gpu-experimental
CPU (experimentell) xgboost-latest-cpu-experimental
MXNet GPU (experimentell) mxnet-latest-gpu-experimental
CPU (experimentell) mxnet-latest-cpu-experimental
CNTK GPU (experimentell) cntk-latest-gpu-experimental
CPU (experimentell) cntk-latest-cpu-experimental
Caffe GPU (experimentell) caffe1-latest-gpu-experimental
CPU (experimentell) caffe1-latest-cpu-experimental

Betriebssystem auswählen

Für die meisten Frameworks ist Debian 10 das Standardbetriebssystem. Ubuntu 18.04-Images sind für einige Frameworks verfügbar. Sie sind durch die Suffixe -ubuntu-1804 im Namen der Imagefamilie gekennzeichnet (siehe Alle verfügbaren Versionen auflisten). Debian 9-Images wurden verworfen.

PyTorch-Images (pytorch-latest-cu110 und alle TensorFlow Enterprise-Imagefamilien (tf-ent und tf2-ent) unterstützen A100-GPU-Beschleuniger.

TensorFlow Enterprise-Images

TensorFlow Enterprise-Imagefamilien bieten eine von Google Cloud optimierte Distribution von TensorFlow. Bestimmte Versionen der TensorFlow Enterprise-Distribution enthalten außerdem Langzeitsupport für die Versionen. Weitere Informationen zu TensorFlow Enterprise finden Sie in der TensorFlow Enterprise-Übersicht.

Die folgende Tabelle der verfügbaren TensorFlow-Images unterstützt Sie bei der Auswahl des Images mit der gewünschten TensorFlow- oder TensorFlow Enterprise-Version.

Version von TensorFlow oder TensorFlow Enterprise Prozessor Image-Familienname Langfristige Versionsunterstützung
TensorFlow Enterprise 2.6 GPU tf2-2-6-cu110 Enthalten
CPU tf2-2-6-cpu Enthalten
TensorFlow Enterprise 2.5 GPU tf2-2-5-cu110 Nicht enthalten
CPU tf2-2-5-cpu Nicht enthalten
TensorFlow 2.4 GPU tf2-2-4-cu110 Nicht enthalten
CPU tf2-2-4-cpu Nicht enthalten
TensorFlow Enterprise 2.3 GPU tf2-2-3-cu110 Enthalten
CPU tf2-2-3-cpu Enthalten
TensorFlow 2.2 GPU tf2-2-2-cu101 Nicht enthalten
CPU tf2-2-2-cpu Nicht enthalten
TensorFlow Enterprise 2.1 GPU tf2-2-1-cu110 Nicht enthalten
CPU tf2-2-1-cpu Nicht enthalten
TensorFlow 2.0 GPU tf2-2-0-cu100 Nicht enthalten
CPU tf2-2-0-cpu Nicht enthalten
TensorFlow Enterprise 1.15 GPU tf-1-15-cu110 Enthalten
CPU tf-1-15-cpu Enthalten
TensorFlow 1.14 GPU tf-1-14-cu100 Nicht enthalten
CPU tf-1-14-cpu Nicht enthalten
TensorFlow 1.13 GPU tf-1-13-cu100 Nicht enthalten
CPU tf-1-13-cpu Nicht enthalten
TensorFlow 1.11 GPU tf-1-11-cu100 Nicht enthalten
CPU tf-1-11-cpu Nicht enthalten
TensorFlow 1.10 GPU tf-1-10-cu100 Nicht enthalten
CPU tf-1-10-cpu Nicht enthalten

Experimentelle Images

Einige Deep Learning-VM-Imagefamilien sind experimentell, wie in der Tabelle der Imagefamilien angegeben. Experimentelle Images werden auf Best-Effort-Basis unterstützt und werden nicht bei jedem neuen Release des Frameworks automatisch aktualisiert.

Imageversion angeben

Images können wiederverwendet werden, auch wenn es bereits eine neuere Version des Image gibt. Dies kann z. B. sinnvoll sein, wenn Sie einen Cluster erstellen und dabei sicher sein möchten, dass neue Instanzen immer mit denselben Images erstellt werden. In diesem Fall sollte nicht der Name der Imagefamilie angegeben werden. Sonst kann es passieren, dass einige Instanzen des Clusters nach der Aktualisierung des neuesten Image unterschiedliche Images haben.

Ermitteln Sie stattdessen den genauen Namen des Image, fügen Sie die Versionsnummer ein und erstellen Sie neue Instanzen im Cluster mit diesem spezifischen Image.

Verwenden Sie den folgenden Befehl im gcloud-Befehlszeilentool mit Ihrem bevorzugten Terminal oder in Cloud Shell, um den genauen Namen des neuesten Images festzustellen. Ersetzen Sie IMAGE_FAMILY durch den Namen der Image-Familie, für die Sie die neueste Versionsnummer ermitteln möchten.

gcloud compute images describe-from-family IMAGE_FAMILY \
        --project deeplearning-platform-release

Suchen Sie in der Ausgabe nach dem Feld name und verwenden Sie den dort angegebenen Imagenamen beim Erstellen neuer Instanzen.

Alle verfügbaren Versionen auflisten

Wenn Sie ein bestimmtes Framework oder eine bestimmte CUDA-Version benötigen, können Sie in der vollständigen Liste der verfügbaren Images danach suchen. Verwenden Sie den folgenden Befehl des gcloud-Tools, um alle verfügbaren Deep Learning-VM-Images aufzulisten.

gcloud compute images list \
        --project deeplearning-platform-release \
        --no-standard-images

Imagefamilien haben das Format FRAMEWORK-VERSION-CUDA_VERSION(-experimental), wobei FRAMEWORK die Zielbibliothek, VERSION die Framework-Version und CUDA_VERSION die Version des CUDA-Stacks ist, falls vorhanden.

So verwendet beispielsweise ein Image aus der Familie tf2-ent-2-3-cu110 das Framework TensorFlow 2.3 und CUDA 11.0.

Nächste Schritte

Erstellen einer neuen Deep Learning-VM-Instanz über den Cloud Marketplace oder über die Befehlszeile.