Dataproc-HBase-Komponente

Sie können zusätzliche Komponenten installieren, wenn Sie einen Dataproc-Cluster mit dem Feature Optionale Komponenten erstellen. Auf dieser Seite wird die HBase-Komponente erläutert.

Die Apache HBASE-Komponente ist eine Hadoop-Datenbank: ein verteilter, skalierbarer Big-Data-Speicher. Der HBase-Server und die Web-UI sind über den Port 16010 auf dem ersten Masterknoten des Dataproc-Clusters verfügbar. Sie können die HBase-Befehlszeile mit dem hbase shell-Befehl in einem Terminalfenster auf dem ersten Masterknoten des Clusters aufrufen.

Komponente installieren

Installieren Sie die Komponente, wenn Sie einen Dataproc-Cluster erstellen. Die Hbase-Komponente kann Clustern hinzugefügt werden, die mit Dataproc Version 1.5 und höher erstellt wurden. Für die Komponente „HBase“ ist die Installation der Komponente ZooKeeper erforderlich, wie unten in der Google Cloud CLI und Konsolenbeispielen gezeigt.

Informationen zu den Komponentenversionen, die im jeweiligen Dataproc-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Dataproc-Versionen.

gcloud-Befehl

Verwenden Sie zum Erstellen eines Dataproc-Clusters, der die HBase-Komponente enthält, die Befehle gcloud beta cluster cluster-name mit den Flags --region und --optional-components.

gcloud beta dataproc clusters create cluster-name \
    --optional-components=HBASE,ZOOKEEPER \
    --region=region \
    --enable-component-gateway \
    ... other flags

REST API

Die HBase- und erforderlichen ZooKeeper-Komponenten können über die Dataproc API mit SoftwareConfig.Component als Teil einer clusters.create-Anfrage angegeben werden.

Console

  1. Aktivieren Sie das Komponenten- und Komponentengateway.
    • Öffnen Sie in der Google Cloud Console die Dataproc-Seite Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt.
    • Im Abschnitt „Komponenten“:
      • Wählen Sie unter Optionale Komponenten HBase, ZooKeeper und andere optionale Komponenten aus, die auf Ihrem Cluster installiert werden sollen.
      • Wählen Sie unter Component Gateway „Component Gateway aktivieren“ aus.

Apache HBase-UI öffnen

Klicken Sie in der Google Cloud Console unter Links zu Komponenten der Google Cloud Console auf HBase, um die Apache HBase-UI zu öffnen.

HBase-Konfigurationsattribute festlegen

Obwohl die standardmäßigen HBase-Konfigurationseinstellungen für die meisten Anwendungen ausreichend sein sollten, können Sie die HBase-Konfigurationseinstellungen bei der Erstellung ändern. Legen Sie dafür Clusterattribute mit dem Dateipräfix hbase: fest.

Beispiel für den Befehl gcloud, um hbase.rootdir in hbase-site.xml festzulegen:

gcloud beta dataproc clusters create my-cluster \
    --optional-components=HBASE,ZOOKEEPER \
    --properties=hbase:hbase.rootdir=hdfs://...
    ... other flags (see Installing the component)