HBase-Komponente von Dataproc

Sie können zusätzliche Komponenten installieren, wenn Sie einen Dataproc-Cluster mit dem Feature Optionale Komponenten erstellen. Auf dieser Seite wird die HBase-Komponente beschrieben.

Die Apache HBase-Komponente ist die Hadoop-Datenbank: ein verteilter, skalierbarer Big-Data-Speicher. Der HBase-Server und die Web-UI sind über Port 16010 auf dem ersten Masterknoten des Dataproc-Clusters verfügbar. Sie können die HBase-Befehlszeile mit dem Befehl hbase shell in einem Terminalfenster auf dem ersten Masterknoten des Clusters aufrufen.

Komponente installieren

Installieren Sie die Komponente, wenn Sie einen Dataproc-Cluster erstellen. Die Hbase-Komponente kann Clustern hinzugefügt werden, die mit Dataproc Version 1.5 und höher erstellt wurden. Für die HBase-Komponente ist die Installation der Zookeeper-Komponente erforderlich. Siehe dazu das gcloud-Befehlszeilentool und die folgenden Beispiele zu dieser Konsole.

Informationen zu den Komponentenversionen, die im jeweiligen Dataproc-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Dataproc-Versionen.

gcloud-Befehl

Verwenden Sie zum Erstellen eines Dataproc-Clusters, der die HBase-Komponente enthält, den Befehl gcloud beta dataproc clusters create cluster-name mit den Flags --region und --optional-components mit Image-Version 1.5 oder höher.

gcloud beta dataproc clusters create cluster-name \
    --optional-components=HBASE,ZOOKEEPER \
    --region=region \
    --image-version=1.5 \
    --enable-component-gateway \
    ... other flags

REST API

Die HBase- und erforderlichen Zookeeper-Komponenten können über die Dataproc API mithilfe von SoftwareConfig.Component als Teil einer clusters.create-Anfrage angegeben werden.

Console

Die Cloud Console unterstützt derzeit nicht das Erstellen eines Clusters mit der optionalen HBase-Komponente.

HBase-Konfigurationsattribute festlegen

Obwohl die standardmäßigen HBase-Konfigurationseinstellungen für die meisten Anwendungen ausreichend sein sollten, können Sie die HBase-Konfigurationseinstellungen bei der Erstellung ändern. Legen Sie dafür Clusterattribute mit dem Dateipräfix hbase: fest.

Beispiel für den Befehl gcloud, um hbase.rootdir in hbase-site.xml festzulegen:

gcloud beta dataproc clusters create my-cluster \
    --optional-components=HBASE,ZOOKEEPER \
    --properties=hbase:hbase.rootdir=hdfs://...
    ... other flags (see Installing the component)