选择映像

您可以针对自己所选择的框架和处理器使用特定的 Deep Learning VM 映像。目前有支持 TensorFlow、PyTorch 和通用高性能计算的映像,并且有针对仅使用 CPU 的工作流和启用 GPU 的工作流的版本。要查找所需图片,请参阅下表。

确定映像系列

确定使用哪个 Deep Learning VM 映像系列取决于您的需求。下表按框架类型列出了最新版本的映像系列。通过引用名称中包含 latest 的映像系列来创建实例,可以确保您始终获得该映像的最新版本。如果您需要特定的框架版本,请跳转到列出所有可用的版本

框架 处理器 映像名称
基本 GPU common-cu101
common-cu100
common-cu92
common-cu91
common-cu90
CPU common-cpu
TensorFlow 企业版 2.x GPU tf2-latest-gpu
CPU tf2-latest-cpu
TensorFlow 企业版 1.x GPU tf-latest-gpu
CPU tf-latest-cpu
TensorFlow 2.x GPU tf2-2-0-cu100
CPU tf2-2-0-cpu
TensorFlow 1.x GPU tf-1-14-cu100
CPU tf-1-14-cpu
PyTorch GPU pytorch-latest-gpu
CPU pytorch-latest-cpu
R CPU r-latest-cpu-experimental
RAPIDS GPU rapids-latest-gpu-experimental
Chainer GPU chainer-latest-gpu-experimental
CPU chainer-latest-cpu-experimental
XGBoost GPU xgboost-latest-gpu-experimental
CPU xgboost-latest-cpu-experimental
MXNet GPU mxnet-latest-gpu-experimental
CPU mxnet-latest-cpu-experimental
CNTK GPU cntk-latest-gpu-experimental
CPU cntk-latest-cpu-experimental
Caffe GPU caffe1-latest-gpu-experimental
CPU caffe1-latest-cpu-experimental

TensorFlow 企业版映像

TensorFlow 企业版映像系列为您提供了经过 Google Cloud 优化的 TensorFlow 发行版,它包含长期版本支持。要详细了解 TensorFlow 企业版,请参阅 TensorFlow 企业版概览

实验映像

某些 Deep Learning VM 映像系列是实验性的。这些映像由 -experimental 后缀表示。与 TensorFlow、PyTorch 和基础映像不同的是,这些映像受到了最大程度的支持,并且在框架每次发布新版本时可能不会刷新。

指定映像版本

即使最新映像较新,您也可以重复使用原来的映像。这一点在某些情况下很有用,例如,如果您尝试创建集群并且希望确保用于创建新实例的任何映像始终相同。在这种情况下,您不应使用映像系列的名称,这是因为,如果最新映像已更新,则集群中的某些实例会有不同的映像。

相反,您可以确定映像的确切名称和版本号,然后使用该特定映像在集群中生成新实例。

要查找最新映像的确切名称,请在您的首选终端的 gcloud 命令行工具中或在 Cloud Shell 中使用以下命令。将 image-family 替换为您要查找其最新版本号的映像系列名称

gcloud compute images describe-from-family image-family \
            --project deeplearning-platform-release

在输出中查找 name 字段,并在创建新实例时使用其中给出的映像名称。

列出所有可用的版本

如果您需要特定的框架或 CUDA 版本,您可以搜索可用映像的完整列表。要列出所有可用的 Deep Learning VM 映像,请使用以下 gcloud 工具命令。

gcloud compute images list \
            --project deeplearning-platform-release \
            --no-standard-images

映像系列将采用 FRAMEWORK-VERSION-CUDA_VERSION(-experimental) 格式,其中 FRAMEWORK 是目标库,VERSION 是框架版本,CUDA_VERSION 是 CUDA 堆栈(若有)的版本。

例如,来自 tf-1-15-cu100 系列的映像具有 TensorFlow 1.15 和 CUDA 10.0,来自 pytorch-1-4-cpu 系列的映像具有 PyTorch 1.4 但没有 CUDA 堆栈。

预装软件包

所有映像均基于 Debian 9“Stretch”,并且包含以下各项:

  • 列出的框架(例如 TensorFlow)和支持软件包。
  • CUDA 9.0/9.1/9.2/10.0/10.1(仅限 GPU;具体版本取决于框架)
  • CuDNN 7.* 和 NCCL 2.3.*(仅限 GPU;具体版本取决于 CUDA)
  • 带有以下软件包的 Python(2.7 和 3.5):
    • numpy
    • scipy
    • matplotlib
    • pandas
    • Jupyter 笔记本/实验室
    • nltk
    • Pillow
    • scikit-image
    • Opencv-python
    • sklearn