Dataproc establece valores especiales de metadatos para las instancias que se ejecutan en el clúster.
Clave de metadatos | Valor |
---|---|
dataproc-bucket | Nombre del depósito de etapa de pruebas del clúster |
dataproc-region | Región del extremo del clúster |
dataproc-worker-count | Número de nodos trabajadores en el clúster. El valor es 0 para clústeres de un solo nodo. |
dataproc-cluster-name | Nombre del clúster |
dataproc-cluster-uuid | UUID del clúster |
dataproc-role | Función de la instancia, que puede ser Master o Worker |
dataproc-master | Nombre del host del primer nodo principal. El valor es [CLUSTER_NAME]-m en un clúster de nodo único o estándar, o [CLUSTER_NAME]-m-0 en un clúster de alta disponibilidad, en el cual [CLUSTER_NAME] es el nombre de tu clúster. |
dataproc-master-additional | Lista de nombres de host separados por comas para los nodos principales adicionales en un clúster de alta disponibilidad, por ejemplo, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 en un clúster que tiene 3 nodos de instancias principales. |
Puedes usar estos valores para personalizar el comportamiento de las acciones de inicialización.
También puedes usar la marca --metadata
del comando gcloud dataproc clusters create en la CLI de gcloud para proporcionar tus propios metadatos personalizados:
gcloud dataproc clusters create cluster-name \ --region=region \ --metadata=name1=value1,name2=value2... \ ... other flags ...