使用可选组件功能创建 Dataproc 集群时,可以安装 Hive WebHCat 等其他组件。本页面介绍了 Hive WebHCat 组件。
Hive WebHCat
组件为 HCatalog 提供 REST API。集群的第一个主节点上的端口 50111
上提供了 REST 服务。
安装组件
在创建 Dataproc 集群时安装组件。 组件可添加到使用 Dataproc 版本 1.3 及更高版本创建的 集群中。
如需查看每个 Dataproc 映像版本中包含的组件版本,请参阅支持的 Dataproc 版本。
gcloud 命令
要创建包含 Hive WebHCat 组件的 Dataproc 集群,请执行以下操作:
使用
gcloud gclid clusters create cluster-name
并附加 --optional-components
标志。
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
REST API
可以通过 Dataproc API 使用 SoftwareConfig.Component 将 Hive WebHCat 组件指定为 clusters.create 请求的一部分。控制台
- 启用组件。
- 在 Google Cloud 控制台中,打开 Dataproc 创建集群 页面。选中“设置集群”面板。
- 在“组件”部分的“可选组件”下,选择 Hive WebHCat 以及其他一些要在集群上安装的可选组件。