Dataproc の Hive WebHCat コンポーネント

Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、追加コンポーネントをインストールできます。このページでは Hive WebHCat コンポーネントについて説明します。

Hive WebHCat コンポーネントには、HCatalog 用の REST API が用意されています。この REST サービスは、クラスタの最初のマスターノードのポート 50111 で使用できます。

コンポーネントをインストールする

Dataproc クラスタの作成時にコンポーネントをインストールします。 Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。

Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。

gcloud コマンド

Hive WebHCat コンポーネントを含む Dataproc クラスタを作成するには、--optional-componentsフラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します。

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

REST API

Dataproc API を使用して Hive WebHCat コンポーネントを指定するには、clusters.create リクエストの一部として SoftwareConfig.Component を使用します。

Console

  1. コンポーネントを有効にします。
    • Cloud Console で、Dataproc の [クラスタの作成] ページを開きます。[クラスタを設定] サブページが選択されます。
    • [コンポーネント] セクションで次の設定を行います。
      • [オプション コンポーネント] で、Hive WebHCat と、クラスタにインストールするその他のオプション コンポーネントを選択します。