Google Cloud では、ゾーンに分割されたリージョンを使用して、物理的なコンピューティング リソースの地理的なロケーションを定義します。AI Platform Prediction でジョブを行うときに、どのリージョンで行うかを指定します。
通常は、自分の物理的ロケーションまたは対象ユーザーの物理的ロケーションに最も近いリージョンを使用する必要がありますが、以下に示す各サービスの利用可能なリージョンに注意してください。
利用可能なリージョン
AI Platform Prediction は、以下のリージョンで利用可能です。
アメリカ大陸
リージョン | オレゴン us-west1 |
ロサンゼルス us-west2 |
ソルトレイクシティ (us-west3) |
アイオワ us-central1 |
サウスカロライナ us-east1 |
北バージニア us-east4 |
モントリオール northamerica-northeast1 |
サンパウロ southamerica-east1 |
---|---|---|---|---|---|---|---|---|
オンライン予測(従来の MLS1 マシンタイプ) | ||||||||
オンライン予測(N1 マシンタイプ) | ||||||||
バッチ予測 | * | * | * | * | * |
ヨーロッパ
リージョン | ロンドン (europe-west2) |
ベルギー europe-west1 |
オランダ europe-west4 |
チューリッヒ (europe-west6) |
フランクフルト europe-west3 |
フィンランド europe-north1 |
---|---|---|---|---|---|---|
オンライン予測(従来の MLS1 マシンタイプ) | ||||||
オンライン予測(N1 マシンタイプ) | ||||||
バッチ予測 | * | * | * | * | * |
アジア太平洋
リージョン | ムンバイ (asia-south1) |
シンガポール asia-southeast1 |
香港 (asia-east2) |
台湾 asia-east1 |
東京 asia-northeast1 |
大阪 asia-northeast2 |
シドニー australia-southeast1 |
ソウル asia-northeast3 |
---|---|---|---|---|---|---|---|---|
オンライン予測(従来の MLS1 マシンタイプ) | ||||||||
オンライン予測(N1 マシンタイプ) | ||||||||
バッチ予測 | * | * | * | * | * | * | * |
Google Cloud には、AI Platform Prediction 以外のプロダクト用の追加のリージョンも用意されています。
リージョンに関する考慮事項
リソースの不足
us-central1
は GPU とコンピューティング リソースの需要が高いリージョンです。ジョブログに、「Resources are
insufficient in region: <region>. Please try a different region.
」というエラー メッセージが記録されることがあります。
この問題を解決するには、別のリージョンを使用するか後で再試行してください。
Cloud Storage
AI Platform Prediction のジョブは、そのジョブのデータの読み取りと書き込みに使用している Cloud Storage バケットと同じリージョンで行う必要があります。
AI Platform Prediction ジョブのデータの読み取りと書き込みに使用する Cloud Storage バケットには、Standard Storage クラスを使用してください。
オンライン予測
オンライン予測に使用するモデルをデプロイするときに、予測を行うリージョンを指定します。グローバル エンドポイント(
ml.googleapis.com
)またはリージョン エンドポイント(REGION-ml.googleapis.com
)を介してオンライン予測を行う場合、オンライン予測は常にモデルに指定されたデフォルトのリージョンで処理されます。オンライン予測にリージョン エンドポイントを使用すると、モデルとバージョンのリソースが他のリージョンから分離されるため、他のリージョンでのサービス停止からモデルを保護する機能が追加されます。リージョン エンドポイントを使用する場合とグローバル エンドポイントを使用する場合の違いについて詳細を確認してください。オンライン予測の Compute Engine(N1)マシンタイプは、リージョン エンドポイントでのみ使用できます。グローバル エンドポイントを使用する場合、Compute Engine(N1)マシンタイプは使用できません。
オンライン予測に GPU を使用する
オンライン予測に GPU を使用できるのは、特定のリージョンとリージョン エンドポイントだけです。グローバル エンドポイントでは GPU を使用できません。次の表に、リージョン エンドポイントのオンライン予測に使用できるすべてのアクセラレータを示します。
アメリカ大陸
リージョン | オレゴン us-west1 |
アイオワ us-central1 |
サウスカロライナ us-east1 |
北バージニア us-east4 |
モントリオール northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
ヨーロッパ
リージョン | ロンドン (europe-west2) |
ベルギー europe-west1 |
オランダ europe-west4 |
フランクフルト europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
アジア太平洋
リージョン | シンガポール asia-southeast1 |
台湾 asia-east1 |
東京 asia-northeast1 |
シドニー australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
バッチ予測
バッチ予測を実行するには、リージョン エンドポイントではなく、グローバル API エンドポイントを使用する必要があります。
バッチ予測用のモデルとモデル バージョンは、以下のリージョンにのみデプロイできます。
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
他の利用可能なリージョン(利用可能なリージョン表でアスタリスクが付いているリージョン)でバッチ予測を行うには、Cloud Storage に保存されている TensorFlow SavedModel を使用する必要があります。
バッチ予測のパフォーマンスを最適化するには、予測ジョブを実行して、入力データと出力データを同じリージョンに格納する必要があります(特にきわめて大きなデータセットの場合)。
バッチ予測に使用するモデルをデプロイするときに、予測を実行するデフォルトのリージョンを指定します。バッチ予測ジョブを開始するときに、ジョブを実行するリージョンを指定することで、デフォルトのリージョンをオーバーライドできます。
リソース ロケーションの制限
組織のポリシーの管理者は、リソース ロケーションの制約を作成して、モデルとバッチ予測ジョブに使用できるリージョンを制限できます。AI Platform Prediction にリソース ロケーションの制約を適用する方法をご覧ください