Metadados de cluster

O Dataproc define valores de metadados especiais para as instâncias executadas no cluster:

Chave de metadadosValor
dataproc-bucketNome do bucket de preparação do cluster
dataproc-regionRegião do ponto de extremidade do cluster
dataproc-worker-countNúmero de workers nodes no cluster. O valor é 0 para clusters de nó único.
dataproc-cluster-nameNome do cluster
dataproc-cluster-uuidUUID do cluster
dataproc-rolePapel da instância, Master ou Worker
dataproc-masterNome do host do primeiro nó mestre. O valor é [CLUSTER_NAME]-m em um cluster de nó padrão ou único, ou [CLUSTER_NAME]-m-0 em um cluster de alta disponibilidade, em que [CLUSTER_NAME] é o nome do cluster.
dataproc-master-additionalLista separada por vírgulas de nomes de host para os nós mestres adicionais em um cluster de alta disponibilidade, por exemplo, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 em um cluster com três nós mestres.

É possível usar esses valores para personalizar o comportamento das ações de inicialização.

Também é possível usar a sinalização --metadata do comando gcloud dataproc clusters create na CLI gcloud para fornecer metadados personalizados próprios:

gcloud dataproc clusters create cluster-name \
    --region=region \
    --metadata=name1=value1,name2=value2... \
    ... other flags ...