Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、Hive WebHCat などの追加コンポーネントをインストールできます。このページでは Hive WebHCat コンポーネントについて説明します。
Hive WebHCat コンポーネントには、HCatalog 用の REST API が用意されています。この REST サービスは、クラスタの最初のマスターノードのポート 50111
で使用できます。
コンポーネントをインストールする
Dataproc クラスタの作成時にコンポーネントをインストールします。 Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。
Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。
gcloud コマンド
Hive WebHCat コンポーネントを含む Dataproc クラスタを作成するには、--optional-components
フラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します。
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
REST API
Dataproc API を使用して Hive WebHCat コンポーネントを指定するには、clusters.create リクエストの一部として SoftwareConfig.Component を使用します。Console
- コンポーネントを有効にします。
- Google Cloud コンソールで、Dataproc の [クラスタの作成] ページを開きます。[クラスターを設定] パネルが選択されています。
- [コンポーネント] セクションの [オプション コンポーネント] で、クラスタにインストールする Hive WebHCat とその他のオプション コンポーネントを選択します。