Metadados de cluster

O Cloud Dataproc define valores de metadados especiais para as instâncias executadas no cluster:

Chave de metadadosValor
dataproc-bucketNome do intervalo de preparação do cluster
dataproc-regionRegião do ponto de extremidade do cluster
dataproc-worker-countNúmero de workers nodes no cluster. O valor é 0 para clusters de nó único.
dataproc-cluster-nameNome do cluster
dataproc-cluster-uuidUUID do cluster
dataproc-roleO papel da instância, Master ou Worker
dataproc-masterNome do host do primeiro nó mestre. Em um cluster de nó único ou padrão, o valor é [CLUSTER_NAME]-m. Em um cluster de alta disponibilidade, o valor é [CLUSTER_NAME]-m-0. Observe que [CLUSTER_NAME] representa o nome do seu cluster.
dataproc-master-additionalLista separada por vírgulas de nomes de host para os nós mestres extras em um cluster de alta disponibilidade, por exemplo, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 em um cluster que tem 3 nodes principais.

É possível usar esses valores para personalizar o comportamento das ações de inicialização.

Também é possível usar a sinalização ‑‑metadata do comando gcloud dataproc clusters create no SDK do Cloud para fornecer metadados personalizados próprios:

gcloud dataproc clusters create cluster-name \
  --metadata name1=value1,name2=value2... \
  ... other flags ...