使用 gcloud CLI 创建 Deep Learning VM 实例

本页面介绍如何使用 Google Cloud CLI 创建 Deep Learning VM Image 映像实例。

准备工作

  1. 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  3. 确保您的 Google Cloud 项目已启用结算功能

  4. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  5. 确保您的 Google Cloud 项目已启用结算功能

如需使用 Google Cloud CLI 完成本快速入门中的操作,您必须先安装并初始化 Google Cloud CLI

  1. 按照安装 Google Cloud CLI 上提供的说明下载并安装 Google Cloud CLI。
  2. 按照初始化 Cloud SDK 上提供的说明初始化 SDK。

如需在 Cloud Shell 中使用 gcloud 完成本快速入门中的操作,请先按照启动 Cloud Shell 上提供的说明激活 Cloud Shell。

创建新实例

本部分介绍如何使用以下参数创建 Deep Learning VM 实例:

  • 在 CUDA 9.2 映像上使用 TensorFlow:tf-latest-cu92
  • 在 US West1-B 地区us-west1-b
  • 命名为:my-new-instance
  • 实例类型n1-standard-8
  • 使用 NVIDIA Tesla V100 GPUtype=nvidia-tesla-v100,count=8
  • 启动磁盘大小:120 GB。
  • 将 NVIDIA GPU 驱动程序设置为首次运行时进行安装:install-nvidia-driver=True

在命令行中,输入以下命令:

export IMAGE_FAMILY="tf-latest-cu92"
export ZONE="us-west1-b"
export INSTANCE_NAME="my-new-instance"
export INSTANCE_TYPE="n1-standard-8"
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=8" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=120GB \
        --metadata="install-nvidia-driver=True"

经过一段时间后,系统会创建虚拟机实例并显示其配置的摘要信息。

您刚刚创建了第一个 Deep Learning VM 实例。 如需验证实例并查看其状态,请使用如下所示的 gcloud list 命令列出所有实例:

gcloud compute instances list

此命令会显示当前项目中所有地区的所有 Compute Engine 实例。

您还可以在 Google Cloud Console 上的 Compute Engine 虚拟机实例中查看和维护 Deep Learning VM 实例。

如需仅查看此实例的状态,请运行以下命令:

gcloud compute instances describe $INSTANCE_NAME

访问新实例

创建 Deep Learning VM 实例后,它会自动启动。您可以使用以下命令通过 SSH 访问它:

gcloud compute ssh $INSTANCE_NAME

Compute Engine 将传递您的 SSH 密钥并创建您的用户。如需了解详情,请参阅连接到实例

停止实例

从本地机器(而不是在实例上)运行以下命令:

gcloud compute instances stop $INSTANCE_NAME

stop 命令会执行彻底的关停操作。

启动实例

初次创建实例后,Compute Engine 会启动它。如需在实例停止后手动启动实例,请运行以下命令:

gcloud compute instances start $INSTANCE_NAME

start 命令会启动已停止的虚拟机实例。

清理

为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。

如需删除您创建的 Deep Learning VM 实例,请在命令行中输入以下命令:

gcloud compute instances delete $INSTANCE_NAME

delete 命令会删除 Compute Engine 实例。

后续步骤