Image auswählen

Passend zum Framework und Prozessor Ihrer Wahl sind verschiedene spezifische Deep Learning-VM-Images verfügbar. Aktuell gibt es Images, die TensorFlow, PyTorch und generisches Hochleistungs-Computing unterstützen. Einige Versionen unterstützen sowohl ausschließlich CPU-basierte als auch GPU-fähige Workflows. Informationen dazu, wie Sie das gewünschte Image finden, enthält die unten stehende Tabelle.

Imagefamilie auswählen

Für welche Deep Learning-VM-Imagefamilie Sie sich entscheiden, hängt von Ihren Anforderungen ab. In der folgenden Tabelle sind die neuesten Versionen von Imagefamilien nach dem Framework-Typ geordnet aufgeführt. Wenn Sie eine Instanz dadurch erstellen, dass Sie auf eine Imagefamilie mit latest im Namen verweisen, achten Sie darauf, dass Sie immer die neueste Version dieses Images erhalten. Wenn Sie eine bestimmte Framework-Version benötigen, fahren Sie mit Alle verfügbaren Versionen auflisten fort.

Framework Prozessor Image-Familienname(n)
Basis GPU common-cu113
common-cu110
CPU common-cpu
TensorFlow Enterprise 2.x GPU tf-ent-latest-gpu
CPU tf-ent-latest-cpu
TensorFlow Enterprise 1.x GPU tf-ent-1-15-cu110
CPU tf-ent-1-15-cpu
PyTorch GPU pytorch-latest-gpu
CPU pytorch-latest-cpu
PyTorch XLA TPU/GPU/CPU (experimentell) pytorch-latest-xla
R CPU (experimentell) r-latest-cpu-experimental
RAPIDS GPU (experimentell) rapids-latest-gpu-experimental
Chainer GPU (experimentell) chainer-latest-gpu-experimental
CPU (experimentell) chainer-latest-cpu-experimental
XGBoost GPU (experimentell) xgboost-latest-gpu-experimental
CPU (experimentell) xgboost-latest-cpu-experimental
MXNet GPU (experimentell) mxnet-latest-gpu-experimental
CPU (experimentell) mxnet-latest-cpu-experimental
CNTK GPU (experimentell) cntk-latest-gpu-experimental
CPU (experimentell) cntk-latest-cpu-experimental
Caffe GPU (experimentell) caffe1-latest-gpu-experimental
CPU (experimentell) caffe1-latest-cpu-experimental

Betriebssystem auswählen

Für die meisten Frameworks ist Debian 10 das Standardbetriebssystem. Ubuntu 20.04-Images sind für einige Frameworks verfügbar. Sie sind durch die Suffixe -ubuntu-2004 im Namen der Imagefamilie gekennzeichnet (siehe Alle verfügbaren Versionen auflisten). Debian 9-Images wurden verworfen.

PyTorch- und TensorFlow Enterprise-Imagefamilien unterstützen A100-GPU-Beschleuniger.

Enthaltene Abhängigkeiten

Die Listen der Python-Abhängigkeiten, die in den einzelnen Releases enthalten sind, sind in Cloud Storage verfügbar unter

 gs://deeplearning-platform-release/installed-dependencies/images/RELEASE_MILESTONE

Ersetzen Sie RELEASE_MILESTONE durch die Release-Meilenstein, z. B. m88. Die Listen für die M88-Version finden Sie beispielsweise unter gs://deeplearning-platform-release/installed-dependencies/images/m88/.

TensorFlow Enterprise-Images

TensorFlow Enterprise-Imagefamilien bieten eine von Google Cloud optimierte Distribution von TensorFlow. Bestimmte Versionen der TensorFlow Enterprise-Distribution enthalten außerdem Langzeitsupport für die Versionen. Weitere Informationen zu TensorFlow Enterprise finden Sie in der TensorFlow Enterprise-Übersicht.

Die folgende Tabelle der verfügbaren TensorFlow-Images unterstützt Sie bei der Auswahl des Images mit der gewünschten TensorFlow- oder TensorFlow Enterprise-Version.

Version von TensorFlow oder TensorFlow Enterprise Prozessor Image-Familienname Langfristige Versionsunterstützung
TensorFlow Enterprise 2.7 GPU tf-ent-2-7-cu113 Nicht enthalten
CPU tf-ent-2-7-cpu Nicht enthalten
TensorFlow Enterprise 2.6 GPU tf-ent-2-6-cu110 Enthalten
CPU tf-ent-2-6-cpu Enthalten
TensorFlow Enterprise 2.5 GPU tf-ent-2-5-cu110 Nicht enthalten
CPU tf-ent-2-5-cpu Nicht enthalten
TensorFlow 2.4 GPU tf-2-4-cu110 Nicht enthalten
CPU tf-2-4-cpu Nicht enthalten
TensorFlow Enterprise 2.3 GPU tf-ent-2-3-cu110 Enthalten
CPU tf-ent-2-3-cpu Enthalten
TensorFlow 2.2 GPU tf-2-2-cu101 Nicht enthalten
CPU tf-2-2-cpu Nicht enthalten
TensorFlow Enterprise 2.1 GPU tf-ent-2-1-cu110 Enthalten
CPU tf-ent-2-1-cpu Enthalten
TensorFlow 2.0 GPU tf-2-0-cu100 Nicht enthalten
CPU tf-2-0-cpu Nicht enthalten
TensorFlow Enterprise 1.15 GPU tf-ent-1-15-cu110 Enthalten
CPU tf-ent-1-15-cpu Enthalten
TensorFlow 1.14 GPU tf-1-14-cu100 Nicht enthalten
CPU tf-1-14-cpu Nicht enthalten
TensorFlow 1.13 GPU tf-1-13-cu100 Nicht enthalten
CPU tf-1-13-cpu Nicht enthalten
TensorFlow 1.11 GPU tf-1-11-cu100 Nicht enthalten
CPU tf-1-11-cpu Nicht enthalten
TensorFlow 1.10 GPU tf-1-10-cu100 Nicht enthalten
CPU tf-1-10-cpu Nicht enthalten

Experimentelle Images

Einige Deep Learning-VM-Imagefamilien sind experimentell, wie in der Tabelle der Imagefamilien angegeben. Experimentelle Images werden auf Best-Effort-Basis unterstützt und werden nicht bei jedem neuen Release des Frameworks automatisch aktualisiert.

Imageversion angeben

Images können wiederverwendet werden, auch wenn es bereits eine neuere Version des Image gibt. Dies kann z. B. sinnvoll sein, wenn Sie einen Cluster erstellen und dabei sicher sein möchten, dass neue Instanzen immer mit denselben Images erstellt werden. In diesem Fall sollte nicht der Name der Imagefamilie angegeben werden. Sonst kann es passieren, dass einige Instanzen des Clusters nach der Aktualisierung des neuesten Image unterschiedliche Images haben.

Ermitteln Sie stattdessen den genauen Namen des Image, fügen Sie die Versionsnummer ein und erstellen Sie neue Instanzen im Cluster mit diesem spezifischen Image.

Verwenden Sie den folgenden Befehl im gcloud-Befehlszeilentool mit Ihrem bevorzugten Terminal oder in Cloud Shell, um den genauen Namen des neuesten Images festzustellen. Ersetzen Sie IMAGE_FAMILY durch den Namen der Image-Familie, für die Sie die neueste Versionsnummer ermitteln möchten.

gcloud compute images describe-from-family IMAGE_FAMILY \
        --project deeplearning-platform-release

Suchen Sie in der Ausgabe nach dem Feld name und verwenden Sie den dort angegebenen Imagenamen beim Erstellen neuer Instanzen.

Alle verfügbaren Versionen auflisten

Wenn Sie ein bestimmtes Framework oder eine bestimmte CUDA-Version benötigen, können Sie in der vollständigen Liste der verfügbaren Images danach suchen. Verwenden Sie den folgenden Befehl des gcloud-Tools, um alle verfügbaren Deep Learning-VM-Images aufzulisten.

gcloud compute images list \
        --project deeplearning-platform-release \
        --no-standard-images

Imagefamilien sind nach dem Format FRAMEWORK-VERSION-CUDA_VERSION(-experimental) benannt, wobei FRAMEWORK die Zielbibliothek, VERSION die Framework-Version und CUDA_VERSION die Version des CUDA-Stacks ist, falls vorhanden.

So verwendet beispielsweise ein Image aus der Familie tf-ent-2-7-cu113 das Framework TensorFlow Enterprise 2.7 und CUDA 11.3.

Nächste Schritte

Erstellen einer neuen Deep Learning-VM-Instanz über den Cloud Marketplace oder über die Befehlszeile.