选择映像

您可以针对自己所选择的框架和处理器使用特定的 Deep Learning VM Image 映像。目前有支持 TensorFlow、PyTorch 和通用高性能计算的映像,并且有针对仅使用 CPU 的工作流和启用 GPU 的工作流的版本。如需查找所需图片,请参阅下表。

确定映像系列

确定使用哪个 Deep Learning VM 映像系列取决于您的需求。下表按框架类型列出了最新版本的映像系列。通过引用名称中包含 latest 的映像系列来创建实例,可以确保您始终获得该映像的最新版本。如果您需要特定的框架版本,请跳转到列出所有可用的版本

框架 处理器 映像系列名称
基本 GPU common-cu110
common-cu101
common-cu100
common-cu92
common-cu91
common-cu90
CPU common-cpu
TensorFlow 企业版 2.x GPU tf2-ent-latest-gpu
CPU tf2-ent-latest-cpu
TensorFlow 企业版 1.x GPU tf-ent-latest-gpu
CPU tf-ent-latest-cpu
TensorFlow 2.x GPU tf2-latest-gpu
CPU tf2-latest-cpu
TensorFlow 1.x GPU tf-latest-gpu
CPU tf-latest-cpu
PyTorch GPU pytorch-latest-gpu
CPU pytorch-latest-cpu
PyTorch XLA TPU/GPU/CPU(实验性) pytorch-latest-xla
R CPU(实验性) r-latest-cpu-experimental
RAPIDS GPU(实验性) rapids-latest-gpu-experimental
Chainer GPU(实验性) chainer-latest-gpu-experimental
CPU(实验性) chainer-latest-cpu-experimental
XGBoost GPU(实验性) xgboost-latest-gpu-experimental
CPU(实验性) xgboost-latest-cpu-experimental
MXNet GPU(实验性) mxnet-latest-gpu-experimental
CPU(实验性) mxnet-latest-cpu-experimental
CNTK GPU(实验性) cntk-latest-gpu-experimental
CPU(实验性) cntk-latest-cpu-experimental
Caffe GPU(实验性) caffe1-latest-gpu-experimental
CPU(实验性) caffe1-latest-cpu-experimental

选择操作系统

对于大多数框架,Debian 10 是默认操作系统。某些框架可以使用 Debian 9 和 Ubuntu 18.04 映像。它们由映像系列名称中的 -debian-9-ubuntu-1804 后缀表示(请参阅列出所有可用的版本)。对于以下框架,Debian 9 是默认框架,在 Debian 10 中不可用:

  • Chainer
  • Rapids
  • 具有 GPU 的 Caffe

PyTorch 1.6 Cuda 11 (pytorch-1-6-cu110) 和所有 TensorFlow 企业版(tf-enttf2-ent)映像系列均支持 A100 GPU 加速器。

TensorFlow 企业版映像

TensorFlow 企业版映像系列为您提供了经过 Google Cloud 优化的 TensorFlow 发行版,TensorFlow 企业版发行版的特定版本还提供长期版本支持。如需详细了解 TensorFlow 企业版,请参阅 TensorFlow 企业版概览

请借助下面的可用 TensorFlow 映像表,来选择具有您所需的 TensorFlow 或 TensorFlow 企业版版本的映像。

TensorFlow 或 TensorFlow 企业版的版本 处理器 映像系列名称 长期版本支持
TensorFlow 企业版 2.5 GPU tf2-2-5-cu110 未包含
CPU tf2-2-5-cpu 未包含
TensorFlow 2.4 GPU tf2-2-4-cu110 未包含
CPU tf2-2-4-cpu 未包含
TensorFlow 企业版 2.3 GPU tf2-2-3-cu110 已包含
CPU tf2-2-3-cpu 已包含
TensorFlow 2.2 GPU tf2-2-2-cu101 未包含
CPU tf2-2-2-cpu 未包含
TensorFlow 企业版 2.1 GPU tf2-2-1-cu110 未包含
CPU tf2-2-1-cpu 未包含
TensorFlow 2.0 GPU tf2-2-0-cu100 未包含
CPU tf2-2-0-cpu 未包含
TensorFlow 企业版 1.15 GPU tf-1-15-cu110 已包含
CPU tf-1-15-cpu 已包含
TensorFlow 1.14 GPU tf-1-14-cu100 未包含
CPU tf-1-14-cpu 未包含
TensorFlow 1.13 GPU tf-1-13-cu100 未包含
CPU tf-1-13-cpu 未包含
TensorFlow 1.11 GPU tf-1-11-cu100 未包含
CPU tf-1-11-cpu 未包含
TensorFlow 1.10 GPU tf-1-10-cu100 未包含
CPU tf-1-10-cpu 未包含

实验映像

某些 Deep Learning VM 映像系列处于实验阶段,如映像系列表所示。实验性映像受到了最大程度的支持,并且在框架每次发布新版本时可能不会刷新。

指定映像版本

即使最新映像较新,您也可以重复使用原来的映像。这一点在某些情况下很有用,例如,如果您尝试创建集群并且希望确保用于创建新实例的任何映像始终相同。在这种情况下,您不应使用映像系列的名称,这是因为,如果最新映像已更新,则集群中的某些实例会有不同的映像。

相反,您可以确定映像的确切名称和版本号,然后使用该特定映像在集群中生成新实例。

如需查找最新映像的确切名称,请在您的首选终端的 gcloud 命令行工具中或在 Cloud Shell 中使用以下命令。将 IMAGE_FAMILY 替换为您要查找其最新版本号的映像系列名称。

gcloud compute images describe-from-family IMAGE_FAMILY \
        --project deeplearning-platform-release

在输出中查找 name 字段,并在创建新实例时使用该字段所指定的映像名称。

列出所有可用的版本

如果您需要特定的框架或 CUDA 版本,您可以搜索可用映像的完整列表。如需列出所有可用的 Deep Learning VM 映像,请使用以下 gcloud 工具命令。

gcloud compute images list \
        --project deeplearning-platform-release \
        --no-standard-images

映像系列将采用 FRAMEWORK-VERSION-CUDA_VERSION(-experimental) 格式,其中 FRAMEWORK 是目标库,VERSION 是框架版本,CUDA_VERSION 是 CUDA 堆栈(若有)的版本。

例如,来自 tf2-ent-2-3-cu110 系列的映像具有 TensorFlow 2.3 和 CUDA 11.0,来自 pytorch-1-8-cpu 系列的映像具有 PyTorch 1.8,但没有 CUDA 堆栈。

后续步骤

使用 Cloud Marketplace使用命令行创建新的 Deep Learning VM 实例。