Metadatos de clústeres

Dataproc establece valores de metadatos especiales para las instancias que se ejecutan en tu clúster:

Clave de metadatosValor
dataproc-bucketNombre del depósito de etapa de pruebas del clúster
dataproc-regionRegión del extremo del clúster
dataproc-worker-countNúmero de nodos trabajadores en el clúster. El valor es 0 para clústeres de un solo nodo.
dataproc-cluster-nameNombre del clúster
dataproc-cluster-uuidUUID del clúster
dataproc-roleLa función de la instancia, Master o Worker
dataproc-masterNombre del host del primer nodo principal. El valor es [CLUSTER_NAME]-m en un clúster de nodo único o estándar, o [CLUSTER_NAME]-m-0 en un clúster de alta disponibilidad, en el cual [CLUSTER_NAME] es el nombre de tu clúster.
dataproc-master-additionalLista de nombres de host separados por comas para los nodos principales adicionales en un clúster de alta disponibilidad, por ejemplo, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 en un clúster que tiene 3 nodos de instancias principales.

Puedes usar estos valores para personalizar el comportamiento de las acciones de inicialización.

También puedes usar la marca --metadata del comando gcloud dataproc clusters create en el SDK de Cloud para proporcionar tus propios metadatos personalizados:

    gcloud dataproc clusters create cluster-name \
      --metadata name1=value1,name2=value2... \
      ... other flags ...