Cloud Dataproc の Druid コンポーネント

Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、追加コンポーネントをインストールできます。このページでは、Druid コンポーネントについて説明します。

Apache Druid コンポーネントは、オープンソースの分散 OLAP データストアです。Druid コンポーネントにより、Druid サービスが Dataproc クラスタのマスター(コーディネーター、ブローカー、オーバーロード)ノードとワーカー(履歴、リアルタイム、MiddleManager)ノードにインストールされます。

コンポーネントをインストールする

Dataproc クラスタの作成時にコンポーネントをインストールします。Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。Druid コンポーネントを使用するには、(下記の gcloud コマンドライン ツールの例に示されているように)Zookeeper コンポーネントのインストールが必要です。

Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Cloud Dataproc バージョンをご覧ください。

gcloud コマンド

Druid コンポーネントを組み込んだ Dataproc クラスタを作成するには、--optional-components フラグを指定した gcloud dataproc beta clusters create cluster-name コマンドを使用します(イメージ バージョンとして 1.3 以降を指定してください)。

    gcloud beta dataproc clusters create cluster-name \
        --optional-components=DRUID,ZOOKEEPER \
        --image-version=1.3 \
        --region=region \
      ... other flags
    

REST API

Druid コンポーネントは、clusters.create リクエストの一部として SoftwareConfig.Component を使用して Dataproc API で指定できます。

Console

  1. コンポーネントを有効にします。
    • Cloud Console で、Dataproc の [クラスタの作成] ページを開きます。ページ下部にある [詳細オプション] をクリックして [オプション コンポーネント] セクションを表示します。

    • [コンポーネントを選択] をクリックして [オプション コンポーネント] 選択パネルを開きます。Druid と、クラスタにインストールする他のオプション コンポーネントを選択します。