Dataproc 自動ゾーンプレースメント

Dataproc クラスタを作成すると、クラスタリソースでは Compute Engine ゾーンに基づくリージョンエンドポイントが使用されます。リージョンを選択した場合は、その地域内のゾーンを選択できます。また、ゾーンを省略して、選択したリージョンで Dataproc の自動ゾーン機能によりゾーンを選択できます。ゾーンを選択すると、そのクラスタのすべてのノードがそのゾーンにデプロイされます。

自動ゾーンとリソースの予約

自動ゾーンでは、リソースの予約によって、ゾーン内でのクラスタの作成に次のように優先順位が付けられます。

自動ゾーンは、リクエストされたクラスタリソースを予約済みリソースで完全に満たすだけでなく、ゾーン内にオンデマンドリソースがある場合は、必要に応じて予約済みリソースとオンデマンドリソースを消費して、そのゾーンにクラスタを作成します
自動ゾーンでは、ゾーン内の CPU コア（vCPU）予約の合計に従って、ゾーンを選択する優先順位が付けられます。

例: クラスタ作成リクエストで、20 n2-standard-2 と 1 n2-standard-64 が指定されています（40 + 64 vCPUs をリクエスト）。自動ゾーンでは、ゾーンで使用可能な vCPU の予約の合計に従って、次のゾーンが優先されます。
1. zone-c で利用可能な予約: 3 n2-standard-2 と 1 n2-standard-64（70 vCPUs）
2. zone-b で利用可能な予約: 1 n2-standard-64（64 vCPUs）
3. zone-a で利用可能な予約: 25 n2-standard-2（50 vCPUs）
  
  これらのゾーンのそれぞれが、クラスタリクエストを満たすのに十分な追加のオンデマンド vCPU と他のリソースを持つ場合、自動ゾーンはクラスタ作成用に zone-c を選択します。
リクエストされたクラスタリソースをゾーン内の予約済みリソースとオンデマンドリソースで完全に満たすことができない場合、自動ゾーンは、オンデマンドリソースを使用して、リクエストを満たせる可能性が最も高いゾーンにクラスタを作成します。

自動ゾーンプレースメントを使用する

コンソール

自動ゾーンプレースメントを使用する Dataproc クラスタを作成するには:

Google Cloud コンソールで、Dataproc の [Compute Engine で Dataproc クラスタを作成する] ページを開きます。[クラスタの設定] パネルが選択されています。
[ロケーション] セクションで、次の操作を行います。
- クラスタのリージョンを選択します。
- [ゾーン] で [すべて] を選択します。

gcloud コマンド

自動ゾーンプレースメントを使用する Dataproc クラスタを作成するには、gcloud dataproc clusters create コマンドを使用します。--region フラグにリージョンを設定します。--zone フラグは省略します（フラグを空にしておくか、--zone= または zone="" を設定します）。

注: gcloud config set compute/zone コマンドを実行してデフォルトのゾーンを設定した場合、--zone= または zone="" フラグを gcloud dataproc clusters create に指定して、自動ゾーン機能を有効にする必要があります。Power Shell を使用する場合は、空の引用符を単一引用符で囲む必要があります（--zone='""'）。

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

REST API

自動ゾーンプレースメントを使用する Dataproc クラスタを作成するには、gceClusterConfig.zoneUri フィールドを空のままにした JSON clusters.create API リクエストを作成します。REST エンドポイント https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters に、リージョン名を挿入します。Dataproc の自動ゾーンにより、指定したリージョン内でクラスタ用のゾーンが選択されます。

自動ゾーンプレースメントで短いリソース名を使用: 自動ゾーンプレースメント REST API クラスタ作成リクエストで machineTypeUri や acceleratorTypeUri などのリソース URI を指定する場合は、ゾーンを指定しない短いリソース名を使用します。たとえば、「n1-standard-2」や「nvidia-tesla-t4」です。

Dataproc 自動ゾーン プレースメント

自動ゾーンとリソースの予約

自動ゾーン プレースメントを使用する

コンソール

gcloud コマンド

REST API

Dataproc 自動ゾーンプレースメント

自動ゾーンプレースメントを使用する