Dataproc は、クラスタ内で実行されるインスタンスに対して次のような特別なメタデータ値を設定します。
メタデータのキー | 値 |
---|---|
dataproc-bucket | クラスタのステージング バケットの名前 |
dataproc-region | クラスタのエンドポイントのリージョン |
dataproc-worker-count | クラスタ内のワーカーノードの数。単一ノードクラスタの場合、値は 0 です。 |
dataproc-cluster-name | クラスタの名前 |
dataproc-cluster-uuid | クラスタの UUID |
dataproc-role | インスタンスの役割(Master または Worker ) |
dataproc-master | 最初のマスターノードのホスト名。値は、標準ノードクラスタまたは単一ノードクラスタの場合は [CLUSTER_NAME]-m 、高可用性クラスタの場合は [CLUSTER_NAME]-m-0 です。ここで、[CLUSTER_NAME] はクラスタの名前です。 |
dataproc-master-additional | 高可用性クラスタ内にある追加のマスターノードのホスト名のカンマ区切りリスト。たとえば、クラスタにマスターノードが 3 つある場合は [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 となります。 |
これらの値を使用して、初期化アクションの動作をカスタマイズできます。
次のように、gcloud CLI で gcloud dataproc clusters create コマンドの --metadata
フラグを使用して独自のカスタム メタデータを指定することもできます。
gcloud dataproc clusters create cluster-name \ --region=region \ --metadata=name1=value1,name2=value2... \ ... other flags ...