Dataproc 自动选择地区功能

创建 Dataproc 集群时,集群资源会使用基于 Compute Engine 区域区域端点。选择区域后,您可以选择该区域内的可用区,也可以省略可用区,以让 Dataproc 自动选择可用区功能在您所选区域中为您选择可用区。选择可用区后,该集群的所有节点都将部署到该可用区。

自动选择可用区和资源预留

自动选择可用区优先在有资源预留的可用区中创建集群,如下所示:

  • 如果请求的集群资源可以通过可用区中的预留资源以及(如有必要)按需资源完全满足,自动选择可用区将使用预留资源和按需资源,并在该可用区中创建集群。

  • 自动选择可用区会根据可用区中的总 CPU 核心 (vCPU) 预留量来确定选择可用区的优先级。

    示例:集群创建请求指定了 20 个 n2-standard-2 和 1 个 n2-standard-64(请求的 40 + 64 个 vCPUs)。自动选择可用区功能会根据可用区中可用的总 vCPU 预留量,优先选择以下可用区:

    1. zone-c 可用预订:3 n2-standard-2 和 1 n2-standard-64(70 vCPUs
    2. zone-b 可用预订:1 n2-standard-64(64 vCPUs
    3. zone-a 可用预订:25 n2-standard-2(50 vCPUs

      假设上述每个可用区都有足够满足集群请求的额外按需 vCPU 和其他资源,自动选择可用区将选择 zone-c 来创建集群。

  • 如果可用区中的预留资源和按需资源无法完全满足所请求的集群资源,自动选择可用区将在最有可能使用按需资源满足请求的可用区中创建集群。

使用自动选择地区功能

控制台

如需创建使用自动选择可用区功能的 Dataproc 集群,请执行以下操作:

  • 在 Google Cloud 控制台中,打开 Dataproc 的在 Compute Engine 上创建 Dataproc 集群页面。选中设置集群面板。
  • 位置部分中:
    • 为您的集群选择一个区域
    • 可用区下,选择“任意”。

gcloud 命令

如需创建使用自动选择区域功能的 Dataproc 集群,请使用 gcloud dataproc 集群创建命令。将 --region 标志设置为用于某个区域,并忽略 --zone 标志(或将该标志留空:--zone=zone="")。

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

REST API

如需创建使用自动选择区域功能的 Dataproc 集群,请构建 JSON clusters.create API 请求,并将 gceClusterConfig.zoneUri 字段留空。在 REST 端点 https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters 中,插入一个区域名称。Dataproc 自动区域选择功能将为指定区域内的集群选择一个区域。

在自动选择可用区功能中使用短资源名称:在自动选择可用区功能 REST API 集群创建请求中指定资源 URI(例如 machineTypeUriacceleratorTypeUri)时,请使用不包含可用区说明的短资源名称,例如“n1-standard-2”或“nvidia-tesla-t4”。