Dataproc 会为集群中运行的实例设置特殊元数据值:
元数据键 | 值 |
---|---|
dataproc-bucket | 集群的暂存存储分区的名称 |
dataproc-region | 集群端点所在的区域 |
dataproc-worker-count | 集群中的工作器节点数。对于单节点集群,值为 0 。 |
dataproc-cluster-name | 集群的名称 |
dataproc-cluster-uuid | 集群的 UUID |
dataproc-role | 实例的角色(Master 或 Worker ) |
dataproc-master | 第一个主节点的主机名。该值为 [CLUSTER_NAME]-m (在标准或单个节点集群中)或 [CLUSTER_NAME]-m-0 (在高可用性集群中),其中 [CLUSTER_NAME] 是您的集群名称。 |
dataproc-master-additional | 高可用性集群中其他主节点的主机名列表(用英文逗号分隔),例如具有 3 个主节点的集群中的 [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 。 |
您可以使用这些值来自定义初始化操作的行为。
您还可以在 gcloud CLI 中使用 gcloud dataproc clusters create 命令的 --metadata
标志来提供自己的自定义元数据:
gcloud dataproc clusters create cluster-name \ --region=region \ --metadata=name1=value1,name2=value2... \ ... other flags ...