创建 Dataproc 时,您可以安装其他组件,例如 Zeppelin 使用 可选组件 功能。本页面介绍了 Zeppelin 组件。
Zeppelin 笔记本
组件是一种基于 Web 的笔记本,用于交互式数据分析。您可以通过集群的第一个主节点上的 8080
端口访问 Zeppelin Web 界面。
默认情况下,笔记本保存在 Cloud Storage 的 Dataproc 暂存存储分区中,该存储分区由用户指定或在创建集群时自动创建。您可以在创建集群时通过 zeppelin:zeppelin.notebook.gcs.dir
属性更改该位置。
安装组件
在创建 Dataproc 集群时安装组件。 组件可添加到使用 Dataproc 版本 1.3 及更高版本创建的 集群中。
如需查看每个 Dataproc 映像版本中包含的组件版本,请参阅支持的 Dataproc 版本。
gcloud 命令
要创建包含 Zeppelin 组件的 Dataproc 集群,请执行以下操作:
使用
gcloud gclid clusters create cluster-name
并附加 --optional-components
标志。
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
REST API
可以通过 Dataproc API 使用 SoftwareConfig.Component 将 Zeppelin 组件指定为 clusters.create 请求的一部分。控制台
- 启用组件和组件网关。
- 在 Google Cloud 控制台中,打开 Dataproc 创建集群页面。选中“设置集群”面板。
- 在组件部分中执行以下操作:
- 在可选组件下,选择 Zeppelin 和其他可选组件安装在集群上。
- 在“组件网关”下,选择“启用组件网关”(请参阅查看和访问组件网关网址)。
打开 Zeppelin 笔记本
请参阅查看和访问组件网关网址 点击 Google Cloud 控制台上的组件网关链接,以打开 在本地的集群主节点上运行的 Zeppelin 笔记本界面 。