Dataproc 可选 Zeppelin 组件

创建 Dataproc 时,您可以安装其他组件,例如 Zeppelin 使用 可选组件 功能。本页面介绍了 Zeppelin 组件。

Zeppelin 笔记本 组件是一种基于 Web 的笔记本,用于交互式数据分析。您可以通过集群的第一个主节点上的 8080 端口访问 Zeppelin Web 界面。

默认情况下,笔记本保存在 Cloud Storage 的 Dataproc 暂存存储分区中,该存储分区由用户指定或在创建集群时自动创建。您可以在创建集群时通过 zeppelin:zeppelin.notebook.gcs.dir 属性更改该位置。

安装组件

在创建 Dataproc 集群时安装组件。 组件可添加到使用 Dataproc 版本 1.3 及更高版本创建的 集群中。

如需查看每个 Dataproc 映像版本中包含的组件版本,请参阅支持的 Dataproc 版本

gcloud 命令

要创建包含 Zeppelin 组件的 Dataproc 集群,请执行以下操作: 使用 gcloud gclid clusters create cluster-name 并附加 --optional-components 标志。

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

REST API

可以通过 Dataproc API 使用 SoftwareConfig.Component 将 Zeppelin 组件指定为 clusters.create 请求的一部分。

控制台

  1. 启用组件和组件网关。
    • 在 Google Cloud 控制台中,打开 Dataproc 创建集群页面。选中“设置集群”面板。
    • 在组件部分中执行以下操作:
      • 在可选组件下,选择 Zeppelin 和其他可选组件安装在集群上。
      • 在“组件网关”下,选择“启用组件网关”(请参阅查看和访问组件网关网址)。

打开 Zeppelin 笔记本

请参阅查看和访问组件网关网址 点击 Google Cloud 控制台上的组件网关链接,以打开 在本地的集群主节点上运行的 Zeppelin 笔记本界面 。