クラスタのメタデータ

Dataproc は、クラスタ内で実行されるインスタンスに対して次のような特別なメタデータ値を設定します。

メタデータのキー
dataproc-bucketクラスタのステージング バケットの名前
dataproc-regionクラスタのエンドポイントのリージョン
dataproc-worker-countクラスタ内のワーカーノードの数。単一ノードクラスタの場合、値は 0 です。
dataproc-cluster-nameクラスタの名前
dataproc-cluster-uuidクラスタの UUID
dataproc-roleインスタンスの役割(Master または Worker
dataproc-master最初のマスターノードのホスト名。値は、標準ノードクラスタまたは単一ノードクラスタの場合は [CLUSTER_NAME]-m高可用性クラスタの場合は [CLUSTER_NAME]-m-0 です。ここで、[CLUSTER_NAME] はクラスタの名前です。
dataproc-master-additional高可用性クラスタ内にある追加のマスターノードのホスト名のカンマ区切りリスト。たとえば、クラスタにマスターノードが 3 つある場合は [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2となります。

これらの値を使用して、初期化アクションの動作をカスタマイズできます。

次のように、gcloud CLI に含まれる gcloud dataproc clusters create コマンドの --metadata フラグを使用して独自のカスタム メタデータを指定することもできます。

gcloud dataproc clusters create cluster-name \
    --region=region \
    --metadata=name1=value1,name2=value2... \
    ... other flags ...