Sie können zusätzliche Komponenten wie Hive WebHCat installieren, wenn Sie einen Dataproc-Cluster mit der Funktion Optionale Komponenten erstellen. Auf dieser Seite wird die Hive WebHCat-Komponente erläutert.
Die Hive WebHCat-Komponente stellt eine REST API für HCatalog zur Verfügung. Der REST-Dienst ist über Port 50111
im ersten Masterknoten des Clusters verfügbar.
Komponente installieren
Installieren Sie die Komponente, wenn Sie einen Dataproc-Cluster erstellen. Sie können Komponenten in Cluster einfügen, die mit Dataproc Version 1.3 oder höher erstellt wurden.
Informationen zu den Komponentenversionen, die im jeweiligen Dataproc-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Dataproc-Versionen.
gcloud-Befehl
Verwenden Sie zum Erstellen eines Dataproc-Clusters, der die Hive WebHCat-Komponente enthält, den Befehl gcloud dataproc clusters create cluster-name mit dem Flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
REST API
Die Hive WebHCat-Komponente kann über die Dataproc-API mit SoftwareConfig.Component als Teil einer clusters.create-Anfrage angegeben werden.Console
- Aktivieren Sie die Komponente.
- Öffnen Sie in der Google Cloud Console die Dataproc-Seite Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt.
- Wählen Sie im Abschnitt „Komponenten“ unter „Optionale Komponenten“ die Option „Hive WebHCat“ und andere optionale Komponenten aus, die im Cluster installiert werden sollen.