Optionale Dataproc-Komponente „Hive WebHCat“

Sie können zusätzliche Komponenten wie Hive WebHCat installieren, wenn Sie einen Dataproc-Cluster mit der Funktion Optionale Komponenten erstellen. Auf dieser Seite wird die Hive WebHCat-Komponente erläutert.

Die Hive WebHCat-Komponente stellt eine REST API für HCatalog zur Verfügung. Der REST-Dienst ist über Port 50111 im ersten Masterknoten des Clusters verfügbar.

Komponente installieren

Installieren Sie die Komponente, wenn Sie einen Dataproc-Cluster erstellen. Sie können Komponenten in Cluster einfügen, die mit Dataproc Version 1.3 oder höher erstellt wurden.

Informationen zu den Komponentenversionen, die im jeweiligen Dataproc-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Dataproc-Versionen.

gcloud-Befehl

Verwenden Sie zum Erstellen eines Dataproc-Clusters, der die Hive WebHCat-Komponente enthält, den Befehl gcloud dataproc clusters create cluster-name mit dem Flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

REST API

Die Hive WebHCat-Komponente kann über die Dataproc-API mit SoftwareConfig.Component als Teil einer clusters.create-Anfrage angegeben werden.

Console

  1. Aktivieren Sie die Komponente.
    • Öffnen Sie in der Google Cloud Console die Dataproc-Seite Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt.
    • Wählen Sie im Abschnitt „Komponenten“ unter „Optionale Komponenten“ die Option „Hive WebHCat“ und andere optionale Komponenten aus, die im Cluster installiert werden sollen.