Metadatos de clústeres

Dataproc establece valores especiales de metadatos para las instancias que se ejecutan en el clúster.

Clave de metadatosValor
dataproc-bucketNombre del depósito de etapa de pruebas del clúster
dataproc-regionRegión del extremo del clúster
dataproc-worker-countNúmero de nodos trabajadores en el clúster. El valor es 0 para clústeres de un solo nodo.
dataproc-cluster-nameNombre del clúster
dataproc-cluster-uuidUUID del clúster
dataproc-roleFunción de la instancia, que puede ser Master o Worker
dataproc-masterNombre del host del primer nodo principal. El valor es [CLUSTER_NAME]-m en un clúster de nodo único o estándar, o [CLUSTER_NAME]-m-0 en un clúster de alta disponibilidad, en el cual [CLUSTER_NAME] es el nombre de tu clúster.
dataproc-master-additionalLista de nombres de host separados por comas para los nodos principales adicionales en un clúster de alta disponibilidad, por ejemplo, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 en un clúster que tiene 3 nodos de instancias principales.

Puedes usar estos valores para personalizar el comportamiento de las acciones de inicialización.

También puedes usar la marca --metadata del comando gcloud dataproc clusters create en el SDK de Cloud para proporcionar tus propios metadatos personalizados:

gcloud dataproc clusters create cluster-name \
    --region=region \
    --metadata=name1=value1,name2=value2... \
    ... other flags ...