区域

Google Cloud 使用区域(可细分为地区)来定义物理计算资源的地理位置。当您在 AI Platform Training 上运行作业时,您可以指定要在哪个区域运行。

您通常应该在与您的物理位置或目标用户的物理位置最接近的区域运行作业,但请注意下面列出的每项服务的可用区域。

可用区域

AI Platform Training 可在以下区域使用:

美洲

  • 俄勒冈 (us-west1)
  • 洛杉矶 (us-west2)
  • 盐湖城 (us-west3)
  • 爱荷华 (us-central1)
  • 南卡罗来纳 (us-east1)
  • 北弗吉尼亚 (us-east4)
  • 蒙特利尔 (northamerica-northeast1)
  • 圣保罗 (southamerica-east1)

欧洲

  • 伦敦 (europe-west2)
  • 比利时 (europe-west1)
  • 荷兰 (europe-west4)
  • 苏黎世 (europe-west6)
  • 法兰克福 (europe-west3)
  • 芬兰 (europe-north1)

亚太地区

  • 孟买 (asia-south1)
  • 新加坡 (asia-southeast1)
  • 香港 (asia-east2)
  • 台湾 (asia-east1)
  • 东京 (asia-northeast1)
  • 大阪 (asia-northeast2)
  • 悉尼 (australia-southeast1)
  • 首尔 (asia-northeast3)

Google Cloud 还为除 AI Platform Training 之外的产品提供了其他区域

区域注意事项

使用加速器进行训练

加速器按区域提供。下表列出了每个区域可以使用的所有加速器:

美洲

区域 俄勒冈
us-west1
洛杉矶
us-west2
盐湖城
us-west3
爱荷华
us-central1
南卡罗来纳
us-east1
北弗吉尼亚
us-east4
蒙特利尔
northamerica-northeast1
圣保罗
southamerica-east1
NVIDIA A100
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100
TPU v2
TPU v3(测试版)
TPU v2 Pod(预览版)
TPU v3 Pod(预览版)

欧洲

区域 伦敦
europe-west2
比利时
europe-west1
荷兰
europe-west4
苏黎世
europe-west6
法兰克福
europe-west3
芬兰
europe-north1
NVIDIA A100
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100
TPU v2
TPU v3(测试版)
TPU v2 Pod(预览版)
TPU v3 Pod(预览版)

亚太地区

区域 孟买
asia-south1
新加坡
asia-southeast1
香港
asia-east2
台湾
asia-east1
东京
asia-northeast1
大阪
asia-northeast2
悉尼
australia-southeast1
首尔
asia-northeast3
NVIDIA A100
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100
TPU v2
TPU v3(测试版)
TPU v2 Pod(预览版)
TPU v3 Pod(预览版)

如果训练作业使用多种类型的 GPU,则它们必须位于您所在区域中的同一个地区。举例来说,如果您的主实例工作器使用 NVIDIA Tesla T4 GPU、参数服务器使用 NVIDIA Tesla K80 GPU,并且工作器使用 NVIDIA Tesla P100 GPU,则无法在 us-central1 中运行作业。虽然 us-central1 中提供所有这些 GPU 以用于训练作业,但该区域中没有一个地区能提供全部三种类型的 GPU。如需详细了解 GPU 的地区可用性,请参阅比较用于处理计算工作负载的 GPU

资源不足

us-central1 区域中,对 GPU 和计算资源的需求很高。您可能会在作业日志中看到一条错误消息,该消息显示 Resources are insufficient in region: <region>. Please try a different region.

如需解决此问题,请尝试使用其他区域或稍后重试。

Cloud Storage

  • 您应该在用于读取和写入作业数据的 Cloud Storage 存储桶所在区域运行 AI Platform Training 作业。

  • 您应该对用来读取和写入 AI Platform Training 作业数据的任何 Cloud Storage 存储分区使用 Standard Storage 类别

限制资源位置

组织政策管理员可通过创建资源位置限制来限制可用于训练作业的区域。了解资源位置限制如何应用于 AI Platform Training