Google Cloud 使用区域(可细分为地区)来定义物理计算资源的地理位置。当您在 AI Platform Prediction 上运行作业时,您可以指定要在哪个区域运行。
您通常应该在与您的物理位置或目标用户的物理位置最接近的区域运行作业,但请注意下面列出的每项服务的可用区域。
可用区域
AI Platform Prediction 可在以下区域使用:
美洲
区域 | 俄勒冈 us-west1 |
洛杉矶 us-west2 |
盐湖城 us-west3 |
爱荷华 us-central1 |
南卡罗来纳 us-east1 |
北弗吉尼亚 us-east4 |
蒙特利尔 northamerica-northeast1 |
圣保罗 southamerica-east1 |
---|---|---|---|---|---|---|---|---|
在线预测(旧版 MLS1 机器类型) | ||||||||
在线预测(N1 机器类型) | ||||||||
批量预测 | * | * | * | * | * |
欧洲
区域 | 伦敦 europe-west2 |
比利时 europe-west1 |
荷兰 europe-west4 |
苏黎世 europe-west6 |
法兰克福 europe-west3 |
芬兰 europe-north1 |
---|---|---|---|---|---|---|
在线预测(旧版 MLS1 机器类型) | ||||||
在线预测(N1 机器类型) | ||||||
批量预测 | * | * | * | * | * |
亚太地区
区域 | 孟买 asia-south1 |
新加坡 asia-southeast1 |
香港 asia-east2 |
台湾 asia-east1 |
东京 asia-northeast1 |
大阪 asia-northeast2 |
悉尼 australia-southeast1 |
首尔 asia-northeast3 |
---|---|---|---|---|---|---|---|---|
在线预测(旧版 MLS1 机器类型) | ||||||||
在线预测(N1 机器类型) | ||||||||
批量预测 | * | * | * | * | * | * | * |
Google Cloud 还为除 AI Platform Prediction 之外的产品提供了其他区域。
区域注意事项
资源不足
在 us-central1
区域中,对 GPU 和计算资源的需求很高。您可能会在作业日志中看到一条错误消息,该消息显示 Resources are
insufficient in region: <region>. Please try a different region.
。
如需解决此问题,请尝试使用其他区域或稍后重试。
Cloud Storage
您应该在用于读取和写入作业数据的 Cloud Storage 存储分区所在区域运行 AI Platform Prediction 作业。
您应该对用来读取和写入 AI Platform Prediction 作业数据的任何 Cloud Storage 存储分区使用 Standard 存储空间类别。
在线预测
部署在线预测模型时,您可以指定要在其中运行预测的区域。无论您是通过全球端点 (
ml.googleapis.com
) 还是区域端点 (REGION-ml.googleapis.com
) 与在线预测交互,在线预测始终在为模型指定的默认区域中运行。使用区域端点进行在线预测可以为您的模型提供额外的保护,使其免受其他区域服务中断带来的影响,这是因为它会将您的模型资源和版本资源与其他区域分隔开来。详细了解使用区域端点与使用全球端点之间的区别。用于在线预测的 Compute Engine (N1) 机器类型仅适用于区域端点。使用全球端点时,Compute Engine (N1) 机器类型不可用。
将 GPU 用于在线预测
使用 GPU 进行在线预测仅在特定区域的区域端点上可用。您不能在全球端点上使用 GPU。下表列出了每个区域性端点所有可用于在线预测的加速器:
美洲
区域 | 俄勒冈 us-west1 |
爱荷华 us-central1 |
南卡罗来纳 us-east1 |
北弗吉尼亚 us-east4 |
蒙特利尔 northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
欧洲
区域 | 伦敦 europe-west2 |
比利时 europe-west1 |
荷兰 europe-west4 |
法兰克福 europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
亚太地区
区域 | 新加坡 asia-southeast1 |
台湾 asia-east1 |
东京 asia-northeast1 |
悉尼 australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
批量预测
如需执行批量预测,您必须使用全球 API 端点,而不是区域性端点。
您只能在以下区域中部署模型和模型版本以进行批量预测:
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
要在其他可用区域(在“可用区域”表中标有星号的区域)中执行批量预测,您必须使用 Cloud Storage 中存储的 TensorFlow SavedModel。
为了使批量预测具有最佳性能,您应该在同一区域运行预测作业并存储您的输入和输出数据,尤其是对于非常大的数据集而言。
部署批量预测模型时,您可以指定要在其中运行预测的默认区域。启动批量预测作业时,您可以指定要在其中运行作业的区域,以替换默认区域。
限制资源位置
组织政策管理员可通过创建资源位置限制来限制可用于模型和批量预测作业的区域。了解资源位置限制如何应用于 AI Platform Prediction