可用的 GPU

GPU 用于加速工作负载,Cloud Workstations 支持将 GPU 挂接到工作站。Cloud Workstations 支持多种可挂接到 Compute Engine 虚拟机的各种 GPU 模型。要挂接到每个工作站的 GPU 的型号和数量在工作站配置中指定。Cloud Workstations 负责挂接 GPU 和安装其设备驱动程序。

将 GPU 挂接到工作站将影响 Cloud Workstations 价格概览中所述的费用。

限制

工作站配置可以指定 GPU,但受到以下限制:

支持的 GPU 型号

Cloud Workstations 支持 Compute Engine 提供的许多 GPU 模型。支持的模型取决于为工作站配置选择的机器系列,如下表所示。

N1 机器系列

N1 通用机器系列支持多种 GPU 模型,指定任何 N1 机器类型的工作站配置还可以指定以下某个 GPU 模型。对于所选的 GPU 型号,配置可以指定要挂接到每个工作站的 GPU 卡数量。

GPU 模型 GPU 数量
NVIDIA T4 (nvidia-tesla-t4) 1、2 或 4 个 GPU
NVIDIA P4 (nvidia-tesla-p4) 1、2 或 4 个 GPU
NVIDIA V100 (nvidia-tesla-v100) 1、2、4 或 8 个 GPU
NVIDIA P100 (nvidia-tesla-p100) 1、2 或 4 个 GPU

A2 机器系列

A2 标准加速器优化机器系列挂接了固定数量的 NVIDIA A100 GPU,仅基于所选的机器类型。

下表显示了从机器类型与将要挂接的卡数量之间的对应关系。

GPU 模型 机器类型 GPU 数量
NVIDIA A100 40GB (nvidia-tesla-a100) a2-highgpu-1g 1 个 GPU
a2-highgpu-2g 2 个 GPU
a2-highgpu-4g 4 个 GPU
a2-highgpu-8g 8 个 GPU
a2-megagpu-16g 16 个 GPU

Cloud Workstations 不支持 A2 Ultra 机器类型。

将 GPU 添加到现有工作站配置

如需将 GPU 添加到工作站配置,请完成以下任一标签页中的步骤。

准备工作

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

安装 Google Cloud CLI,然后通过运行以下命令初始化 Google Cloud CLI:

gcloud init

查看 Cloud Workstations 价格概览,了解配置 GPU 将如何影响您的费用。请注意,GPU 会挂接到由配置的快速入门池大小指定的预启动虚拟机 (VM)。

更新现有配置

控制台

如需通过 Google Cloud 控制台在现有工作站配置上配置 GPU,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往工作站配置页面。

    前往“工作站配置”页面

  2. 工作站配置列表中,点击要添加 GPU 的配置的名称

  3. Workstation configuration details(工作站配置详情)页面上,点击 edit(修改)图标 Edit(修改)。

  4. 修改工作站配置页面上,点击导航菜单中的机器设置

  5. 点击切换开关,选择 GPU 而不是通用机器系列。

    GPU 类型字段中,选择您要使用的 GPU 型号。

    GPU 数量字段中,选择要挂接到每个工作站的 GPU 卡的数量。

    机器类型字段中,选择要使用的机器类型。

  6. 点击保存以更新配置。

gcloud

通过运行 gcloud workstations configs update 命令在现有工作站配置上配置 GPU。

不过,请先收集一些信息以查看可用的 GPU 模型,并为您的配置选择一个模型:

  1. 通过运行以下 gcloud CLI 命令检查配置指定的副本地区:

    gcloud workstations configs describe \
      --format="table(name.scope(workstationConfigs),replicaZones.list())" \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=WORKSTATION_CLUSTER_ID \
      WORKSTATION_CONFIG_ID
    

    请替换以下内容:

    • PROJECT_ID:包含工作站配置的项目的 ID。
    • LOCATION:工作站集群的位置。
    • WORKSTATION_CLUSTER_ID:包含工作站配置的工作站集群名称。
    • WORKSTATION_CONFIG_ID:工作站配置的名称。
  2. 通过运行 gcloud compute accelerator-types list 命令选择在配置的两个副本区域中都可用的受支持的 GPU 型号:

    gcloud compute accelerator-types list \
      --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
      --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
      --project=PROJECT_ID
    

    ZONES 替换为上一步确定的副本地区的逗号分隔列表(例如 us-central1-a,us-central1-c)。

    选择在表中列出了两次的 GPU 模型,表示该模型在两个副本区域中都可用。

    记下您可以为所选 GPU 型号附加的显卡数量上限。

  3. 使用 gcloud compute machine-types list 命令确定配置的两个副本可用区中都提供哪些受支持的机器类型。

    1. 如果您在上一步中选择了 NVIDIA A100 40GB GPU 型号,则您的配置必须使用 A2 机器系列:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:a2-highgpu- OR name:a2-megagpu-" \
        --zones=ZONES \
        --project=PROJECT_ID
      
    2. 如果您在上一步中选择了任何其他 GPU 型号,则您的配置必须使用 N1 机器系列:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:n1-standard-" \
        --zones=ZONES \
        --project=PROJECT_ID
      

    选择在表中列出两次的机器类型,表示该机器类型在两个副本地区中都可用。

  4. 现在您已经选择了 GPU 模型和兼容的机器类型,请更新配置:

    1. 对于 NVIDIA A100 40GB GPU,请运行以下命令来更新您的配置:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=WORKSTATION_CLUSTER_ID \
        WORKSTATION_CONFIG_ID \
        --machine-type=A2_MACHINE_TYPE
      

      A2_MACHINE_TYPE 替换为上一步确定的所选 A2 机器类型(例如 a2-highgpu-1g)。

    2. 对于所有其他 GPU 型号,请运行以下命令:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \ß
        --cluster=WORKSTATION_CLUSTER_ID \
        WORKSTATION_CONFIG_ID \
        --machine-type=N1_MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT
      

      请替换以下内容:

      • N1_MACHINE_TYPE:从 N1 系列中选择的机器类型(例如 n1-standard-2)。
      • ACCELERATOR_TYPE:所选 GPU 型号的名称(例如 nvidia-tesla-t4)。
      • ACCELERATOR_COUNT:要挂接到每个工作站的 GPU 数量(例如 124)。该值必须小于 GPU 模型最大值的 2 倍。

创建具有 GPU 的新工作站配置

如需创建将 GPU 挂接到基于此工作站的工作站的新工作站配置,请完成以下任一标签页中的步骤。

准备工作

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

安装 Google Cloud CLI,然后通过运行以下命令初始化 Google Cloud CLI:

gcloud init

REST

如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的凭据。

    安装 Google Cloud CLI,然后通过运行以下命令初始化 Google Cloud CLI:

    gcloud init

如需了解详情,请参阅 Google Cloud 身份验证文档中的使用 REST 时进行身份验证

选择一个 GPU 模型,并查看 GPU 可用性表,以选择至少在两个区域中提供所选 GPU 模型的区域。

如果所选区域中还没有可用于创建新配置的集群,请按照相关步骤在该区域中创建工作站集群

查看 Cloud Workstations 价格概览,了解配置 GPU 将如何影响您的费用。请注意,GPU 会挂接到由配置的快速入门池大小指定的预启动虚拟机 (VM)。

创建新配置

控制台

通过执行以下操作,从 Google Cloud 控制台创建带有 GPU 的新工作站配置:

  1. 在 Google Cloud 控制台中,前往工作站配置页面。

    前往“工作站配置”页面

  2. 工作站配置页面上,点击 add_box 创建

  3. 创建工作站配置页面的基本信息步骤中,在名称字段中为您的配置指定一个名称。

    工作站集群字段中,选择所选区域中的一个集群。

    点击继续进入机器设置步骤。

  4. 创建工作站配置页面的机器设置步骤中,点击开关以选择 GPU,而不是通用机器系列。

    1. 然后,在可用区字段中,选中所选 GPU 模型可用的两个可用区旁边的复选框(请参阅 GPU 可用性表)。

    2. GPU 类型字段中,选择您要使用的 GPU 型号。

    3. GPU 数量字段中,选择要挂接到每个工作站的 GPU 卡的数量。

    4. 机器类型字段中,选择兼容的机器类型。

  5. 请点击继续以配置环境设置和 IAM 政策,然后点击创建以预配新的工作站配置。

gcloud

使用 gcloud CLI 通过运行 gcloud workstations configs create 命令创建带有 GPU 的新工作站配置。

  • 对于 NVIDIA A100 40 GB GPU,请运行以下命令来创建您的配置:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=WORKSTATION_CLUSTER_ID \
      WORKSTATION_CONFIG_ID \
      --replica-zones=REPLICA_ZONES \
      --machine-type=A2_MACHINE_TYPE
    

    请替换以下内容:

    • PROJECT_ID:将包含新工作站配置的项目的 ID。
    • LOCATION:包含配置的工作站集群的位置。
    • WORKSTATION_CLUSTER_ID:将包含新工作站配置的工作站集群的名称。
    • WORKSTATION_CONFIG_ID:新工作站配置的名称。
    • REPLICA_ZONES:集群所在区域内提供所选 GPU 模型的两个可用区(例如 us-central1-a,us-central1-c)。
    • A2_MACHINE_TYPE:所选的 A2 系列机器类型(例如 a2-highgpu-1g)。
  • 对于所有其他 GPU 型号,请运行以下命令创建配置:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=WORKSTATION_CLUSTER_ID \
      WORKSTATION_CONFIG_ID \
      --replica-zones=REPLICA_ZONES \
      --machine-type=N1_MACHINE_TYPE \
      --accelerator-type=ACCELERATOR_TYPE \
      --accelerator-count=ACCELERATOR_COUNT
    

    请替换以下内容:

    • PROJECT_ID:将包含新工作站配置的项目的 ID。
    • LOCATION:包含配置的工作站集群的位置。
    • WORKSTATION_CLUSTER_ID:将包含新工作站配置的工作站集群的名称。
    • WORKSTATION_CONFIG_ID:新工作站配置的名称。
    • REPLICA_ZONES:集群所在区域内提供所选 GPU 模型的两个可用区(例如 us-central1-a,us-central1-c)。
    • N1_MACHINE_TYPE:所选的 N1 系列机器类型(例如 n1-standard-2)。
    • ACCELERATOR_TYPE:所选 GPU 型号的名称(例如 nvidia-tesla-t4)。
    • ACCELERATOR_COUNT:要挂接到每个工作站的 GPU 数量(例如 124)。

NVIDIA GPU 设备驱动程序

在虚拟机启动期间,Cloud Workstations 会在工作站的主机虚拟机上安装 NVIDIA 设备驱动程序。

如需确定工作站上安装的设备驱动程序的版本,请运行以下命令:

nvidia-smi --query-gpu=name,driver_version --format=csv

各区域和可用区的 GPU 可用性

您可以按位置或 GPU 模型搜索,也可以同时使用两者。

可用区 位置 GPU 平台
asia-east1-a 亚太地区台湾彰化 T4、P100
asia-east1-b 亚太地区台湾彰化
asia-east1-c 亚太地区台湾彰化 T4、V100、P100
asia-east2-a 亚太地区香港 T4
asia-east2-b 亚太地区香港
asia-east2-c 亚太地区香港 T4
asia-northeast1-a 亚太地区日本东京 A100 40GB、T4
asia-northeast1-b 亚太地区日本东京
asia-northeast1-c 亚太地区日本东京 A100 40GB、T4
asia-northeast3-a 亚太地区韩国首尔 A100 40GB
asia-northeast3-b 亚太地区韩国首尔 A100 40GB、T4
asia-northeast3-c 亚太地区韩国首尔 T4
asia-south1-a 亚太地区印度孟买 T4
asia-south1-b 亚太地区印度孟买 T4
asia-south1-c 亚太地区印度孟买 T4
asia-southeast1-a 亚太地区新加坡裕廊西 T4
asia-southeast1-b 亚太地区新加坡裕廊西 A100 40GB、T4、P4
asia-southeast1-c 亚太地区新加坡裕廊西 A100 40GB、T4、P4
australia-southeast1-a 亚太地区澳大利亚悉尼 T4、P4
australia-southeast1-b 亚太地区澳大利亚悉尼 P4
australia-southeast1-c 亚太地区澳大利亚悉尼 T4、P100
europe-north1-a
europe-north1-b
europe-north1-c
欧洲芬兰哈米纳
europe-west1-b 欧洲比利时圣吉斯兰 T4、P100
europe-west1-c 欧洲比利时圣吉斯兰 T4
europe-west1-d 欧洲比利时圣吉斯兰 P100、T4
europe-west2-a
europe-west2-b
欧洲英国伦敦 T4
europe-west2-c 欧洲英国伦敦
europe-west3-a 欧洲德国法兰克福
europe-west3-b 欧洲德国法兰克福 T4
europe-west3-c 欧洲德国法兰克福
europe-west4-a 欧洲荷兰埃姆斯哈文 A100 40GB、T4、V100、P100
europe-west4-b 欧洲荷兰埃姆斯哈文 A100 40GB、T4、P4、V100
europe-west4-c 欧洲荷兰埃姆斯哈文 T4、P4、V100
europe-west6-a
europe-west6-b
europe-west6-c
欧洲瑞士苏黎世
europe-west8-a
europe-west8-b
europe-west8-c
欧洲意大利米兰
europe-west9-a
europe-west9-b
europe-west9-c
欧洲法国巴黎
europe-west12-a
europe-west12-b
europe-west12-c
欧洲意大利都灵
europe-southwest1-a
europe-southwest1-b
europe-southwest1-c
欧洲西班牙马德里
me-west1-a 特拉维夫、以色列、中东
me-west1-b 中东以色列特拉维夫 A100 40GB、T4
me-west1-c 中东以色列特拉维夫 A100 40GB、T4
northamerica-northeast1-a 北美洲魁北克省蒙特利尔 P4
northamerica-northeast1-b 北美洲魁北克省蒙特利尔 P4
northamerica-northeast1-c 北美洲魁北克省蒙特利尔 T4、P4
southamerica-east1-a 南美洲巴西圣保罗省奥萨斯库 T4
southamerica-east1-c 南美洲巴西圣保罗省奥萨斯库 T4
southamerica-west1-a
southamerica-west1-b
southamerica-west1-c
南美洲智利圣地亚哥
us-central1-a 北美洲爱荷华州康瑟布拉夫斯 A100 40GB、T4、P4、V100
us-central1-b 北美洲爱荷华州康瑟布拉夫斯 A100 40GB、T4、V100
us-central1-c 北美洲爱荷华州康瑟布拉夫斯 A100 40GB、T4、P4、V100、P100
us-central1-f 北美洲爱荷华州康瑟布拉夫斯 A100 40GB、T4、V100、P100
us-east1-b 北美洲南卡罗来纳州蒙克斯科纳 A100 40GB、P100
us-east1-c 北美洲南卡罗来纳州蒙克斯科纳 T4、V100、P100
us-east1-d 北美洲南卡罗来纳州蒙克斯科纳 T4
us-east4-a 北美洲弗吉尼亚阿什本 T4、P4
us-east4-b 北美洲弗吉尼亚阿什本 T4、P4
us-east4-c 北美洲弗吉尼亚阿什本 T4、P4
us-east5-a 北美洲俄亥俄州哥伦布 H100 80GB us-east5-b 北美洲俄亥俄州哥伦布 A100 80GB us-east5-c 北美洲俄亥俄州哥伦布
us-west1-a 北美洲俄勒冈州达尔斯 T4、V100、P100
us-west1-b 北美洲俄勒冈州达尔斯 A100 40GB、T4、V100、P100
us-west1-c 北美洲俄勒冈州达尔斯

后续步骤