Dataproc Zeppelin コンポーネント

Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、追加コンポーネントをインストールできます。このページでは Zeppelin コンポーネントについて説明します。

Zeppelin ノートブック コンポーネントは、インタラクティブなデータ分析を行うためのウェブベースのノートブックです。Zeppelin のウェブ UI は、クラスタの最初のマスターノードのポート 8080 で使用できます。

デフォルトでは、ノートブックは Dataproc ステージング バケット内の Cloud Storage に保存されます。保存先バケットは、クラスタの作成時にユーザーが指定するか、指定がなければ自動作成されます。この場所は、クラスタの作成時に zeppelin:zeppelin.notebook.gcs.dir プロパティを使用して変更できます。

コンポーネントをインストールする

Dataproc クラスタの作成時にコンポーネントをインストールします。 Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。

Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。

gcloud コマンド

Zeppelin コンポーネントを含む Dataproc クラスタを作成するには、--optional-components フラグを指定した gcloud dataproc clusters create cluster-nameコマンドを使用します。

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

REST API

Zeppelin コンポーネントは、clusters.create リクエストの一部として SoftwareConfig.Component を使用して Dataproc API で指定できます。

Console

  1. コンポーネントとコンポーネント ゲートウェイを有効にします。
    • Cloud Console で、Dataproc の [クラスタの作成] ページを開きます。[クラスターを設定] パネルが選択されています。
    • [コンポーネント] セクションで次の設定を行います。
      • [オプション コンポーネント] で、クラスタにインストールする Zeppelin や、他のオプション コンポーネントを選択します。
      • [コンポーネント ゲートウェイ] で [コンポーネント ゲートウェイを有効にする] を選択します(コンポーネント ゲートウェイの URL を表示してアクセスするをご覧ください)。

Zeppelin ノートブックを開く

コンポーネント ゲートウェイの URL を表示してアクセスするを参照し、Cloud Console でコンポーネント ゲートウェイ リンクをクリックします。これにより、クラスタのマスターノードで実行されている Zeppelin ノートブックの UI がローカル ブラウザ内に開きます。