区域

Google Cloud 使用区域(可细分为地区)来定义物理计算资源的地理位置。当您在 AI Platform Prediction 上运行作业时,您可以指定要在哪个区域运行。

您通常应该在与您的物理位置或目标用户的物理位置最接近的区域运行作业,但请注意下面列出的每项服务的可用区域。

可用区域

AI Platform Prediction 可在以下区域使用:

美洲

地区 俄勒冈
us-west1
洛杉矶
us-west2
盐湖城
us-west3
爱荷华
us-central1
南卡罗来纳
us-east1
北弗吉尼亚
us-east4
蒙特利尔
northamerica-northeast1
圣保罗
southamerica-east1
在线预测(旧版 MLS1 机器类型)
在线预测(N1 机器类型)
批量预测 * * * * *

欧洲

地区 伦敦
europe-west2
比利时
europe-west1
荷兰
europe-west4
苏黎世
europe-west6
法兰克福
europe-west3
芬兰
europe-north1
在线预测(旧版 MLS1 机器类型)
在线预测(N1 机器类型)
批量预测 * * * * *

亚太地区

地区 孟买
asia-south1
新加坡
asia-southeast1
香港
asia-east2
台湾
asia-east1
东京
asia-northeast1
大阪
asia-northeast2
悉尼
australia-southeast1
首尔
asia-northeast3
在线预测(旧版 MLS1 机器类型)
在线预测(N1 机器类型)
批量预测 * * * * * * *

Google Cloud 还为除 AI Platform Prediction 之外的产品提供了其他区域

区域注意事项

资源不足

us-central1 区域中,对 GPU 和计算资源的需求很高。您可能会在作业日志中看到一条错误消息,该消息显示 Resources are insufficient in region: <region>. Please try a different region.

如需解决此问题,请尝试使用其他区域或稍后重试。

Cloud Storage

  • 您应该在用于读取和写入作业数据的 Cloud Storage 存储分区所在区域运行 AI Platform Prediction 作业。

  • 您应该对用来读取和写入 AI Platform Prediction 作业数据的任何 Cloud Storage 存储分区使用 Standard 存储空间类别

在线预测

  • 部署在线预测模型时,您可以指定要在其中运行预测的区域。无论您是通过全球端点 (ml.googleapis.com) 还是区域端点 (REGION-ml.googleapis.com) 与在线预测交互,在线预测始终在为模型指定的默认区域中运行。使用区域端点进行在线预测可以为您的模型提供额外的保护,使其免受其他区域服务中断带来的影响,这是因为它会将您的模型资源和版本资源与其他区域分隔开来。详细了解使用区域端点与使用全球端点之间的区别。

  • 用于在线预测的 Compute Engine (N1) 机器类型仅适用于地区端点。使用全球端点时,Compute Engine (N1) 机器类型不可用。

将 GPU 用于在线预测

使用 GPU 进行在线预测仅在特定地区的地区端点上可用。您不能在全球端点上使用 GPU。下表列出了每个区域性端点所有可用于在线预测的加速器:

美洲

地区 俄勒冈
us-west1
爱荷华
us-central1
南卡罗来纳
us-east1
北弗吉尼亚
us-east4
蒙特利尔
northamerica-northeast1
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

欧洲

地区 伦敦
europe-west2
比利时
europe-west1
荷兰
europe-west4
法兰克福
europe-west3
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

亚太地区

区域 新加坡
asia-southeast1
台湾
asia-east1
东京
asia-northeast1
悉尼
australia-southeast1
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

批量预测

  • 如需执行批量预测,您必须使用全球 API 端点,而不是区域性端点。

  • 您只能在以下区域中部署模型和模型版本以进行批量预测:

    • us-central1
    • us-east1
    • us-east4
    • europe-west1
    • asia-northeast1

    要在其他可用区域(在“可用区域”表中标有星号的区域)中执行批量预测,您必须使用 Cloud Storage 中存储的 TensorFlow SavedModel

  • 为了使批量预测具有最佳性能,您应该在同一区域运行预测作业并存储您的输入和输出数据,尤其是对于非常大的数据集而言。

  • 部署批量预测模型时,您可以指定要在其中运行预测的默认区域。启动批量预测作业时,您可以指定要在其中运行作业的区域,以替换默认区域。

限制资源位置

组织政策管理员可通过创建资源位置限制来限制可用于模型和批量预测作业的区域。了解资源位置限制如何应用于 AI Platform Prediction