Google Cloud 使用区域(可细分为地区)来定义物理计算资源的地理位置。当您在 AI Platform Training 上运行作业时,您可以指定要在哪个区域运行。
您通常应该在与您的物理位置或目标用户的物理位置最接近的区域运行作业,但请注意下面列出的每项服务的可用区域。
可用区域
AI Platform Training 可在以下区域使用:
美洲
- 俄勒冈 (us-west1)
- 洛杉矶 (us-west2)
- 盐湖城 (us-west3)
- 爱荷华 (us-central1)
- 南卡罗来纳 (us-east1)
- 北弗吉尼亚 (us-east4)
- 蒙特利尔 (northamerica-northeast1)
- 圣保罗 (southamerica-east1)
欧洲
- 伦敦 (europe-west2)
- 比利时 (europe-west1)
- 荷兰 (europe-west4)
- 苏黎世 (europe-west6)
- 法兰克福 (europe-west3)
- 芬兰 (europe-north1)
亚太地区
- 孟买 (asia-south1)
- 新加坡 (asia-southeast1)
- 香港 (asia-east2)
- 台湾 (asia-east1)
- 东京 (asia-northeast1)
- 大阪 (asia-northeast2)
- 悉尼 (australia-southeast1)
- 首尔 (asia-northeast3)
Google Cloud 还为除 AI Platform Training 之外的产品提供了其他区域。
区域注意事项
使用加速器进行训练
加速器按区域提供。下表列出了每个区域可以使用的所有加速器:
美洲
区域 | 俄勒冈 us-west1 |
洛杉矶 us-west2 |
盐湖城 us-west3 |
爱荷华 us-central1 |
南卡罗来纳 us-east1 |
北弗吉尼亚 us-east4 |
蒙特利尔 northamerica-northeast1 |
圣保罗 southamerica-east1 |
---|---|---|---|---|---|---|---|---|
NVIDIA A100 | ||||||||
NVIDIA Tesla P4 | ||||||||
NVIDIA Tesla P100 | ||||||||
NVIDIA Tesla T4 | ||||||||
NVIDIA Tesla V100 | ||||||||
TPU v2 | ||||||||
TPU v3(测试版) | ||||||||
TPU v2 Pod(预览版) | ||||||||
TPU v3 Pod(预览版) |
欧洲
区域 | 伦敦 europe-west2 |
比利时 europe-west1 |
荷兰 europe-west4 |
苏黎世 europe-west6 |
法兰克福 europe-west3 |
芬兰 europe-north1 |
---|---|---|---|---|---|---|
NVIDIA A100 | ||||||
NVIDIA Tesla P4 | ||||||
NVIDIA Tesla P100 | ||||||
NVIDIA Tesla T4 | ||||||
NVIDIA Tesla V100 | ||||||
TPU v2 | ||||||
TPU v3(测试版) | ||||||
TPU v2 Pod(预览版) | ||||||
TPU v3 Pod(预览版) |
亚太地区
区域 | 孟买 asia-south1 |
新加坡 asia-southeast1 |
香港 asia-east2 |
台湾 asia-east1 |
东京 asia-northeast1 |
大阪 asia-northeast2 |
悉尼 australia-southeast1 |
首尔 asia-northeast3 |
---|---|---|---|---|---|---|---|---|
NVIDIA A100 | ||||||||
NVIDIA Tesla P4 | ||||||||
NVIDIA Tesla P100 | ||||||||
NVIDIA Tesla T4 | ||||||||
NVIDIA Tesla V100 | ||||||||
TPU v2 | ||||||||
TPU v3(测试版) | ||||||||
TPU v2 Pod(预览版) | ||||||||
TPU v3 Pod(预览版) |
如果训练作业使用多种类型的 GPU,则它们必须位于您所在区域中的同一个地区。举例来说,如果您的主实例工作器使用 NVIDIA Tesla T4 GPU、参数服务器使用 NVIDIA Tesla K80 GPU,并且工作器使用 NVIDIA Tesla P100 GPU,则无法在 us-central1
中运行作业。虽然 us-central1
中提供所有这些 GPU 以用于训练作业,但该区域中没有一个地区能提供全部三种类型的 GPU。如需详细了解 GPU 的地区可用性,请参阅比较用于处理计算工作负载的 GPU。
资源不足
在 us-central1
区域中,对 GPU 和计算资源的需求很高。您可能会在作业日志中看到一条错误消息,该消息显示 Resources are
insufficient in region: <region>. Please try a different region.
。
如需解决此问题,请尝试使用其他区域或稍后重试。
Cloud Storage
您应该在用于读取和写入作业数据的 Cloud Storage 存储分区所在区域运行 AI Platform Training 作业。
您应该对用来读取和写入 AI Platform Training 作业数据的任何 Cloud Storage 存储分区使用 Standard 存储空间类别。
限制资源位置
组织政策管理员可通过创建资源位置限制来限制可用于训练作业的区域。了解资源位置限制如何应用于 AI Platform Training