Dataproc の Hive WebHCat オプション コンポーネント

Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、Hive WebHCat などの追加コンポーネントをインストールできます。このページでは Hive WebHCat コンポーネントについて説明します。

Hive WebHCat コンポーネントには、HCatalog 用の REST API が用意されています。この REST サービスは、クラスタの最初のマスターノードのポート 50111 で使用できます。

コンポーネントをインストールする

Dataproc クラスタの作成時にコンポーネントをインストールします。 Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。

Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。

gcloud コマンド

Hive WebHCat コンポーネントを含む Dataproc クラスタを作成するには、--optional-componentsフラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します。

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

REST API

Dataproc API を使用して Hive WebHCat コンポーネントを指定するには、clusters.create リクエストの一部として SoftwareConfig.Component を使用します。

Console

  1. コンポーネントを有効にします。
    • Google Cloud コンソールで、Dataproc の [クラスタの作成] ページを開きます。[クラスターを設定] パネルが選択されています。
    • [コンポーネント] セクションの [オプション コンポーネント] で、クラスタにインストールする Hive WebHCat とその他のオプション コンポーネントを選択します。