Componente de HBase de Dataproc

Puedes instalar componentes adicionales cuando creas un clúster de Dataproc con la función de componentes opcionales. En esta página, se describe el componente de HBase.

El componente de Apache HBase es la base de datos de Hadoop: un almacén de macrodatos distribuido y escalable. El servidor de HBase y la IU web están disponibles en el puerto 16010 del primer nodo principal del clúster de Dataproc. Puedes invocar la CLI (interfaz de línea de comandos) de HBase con el comando hbase shell desde una ventana de la terminal en el primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Dataproc. El componente de HBase se puede agregar a los clústeres creados con la versión 1.5 de Dataproc y posteriores. El componente de HBase requiere la instalación del componente Zookeeper, como se muestra en la herramienta de línea de comandos de gcloud y Console, a continuación.

Consulta las versiones compatibles de Dataproc para la versión del componente incluida en cada versión de la imagen de Dataproc.

Comando de gcloud

Para crear un clúster de Dataproc que incluya el componente de HBase, usa el comando cluster-name de gcloud beta dataproc clusters create con las marcas --region y --optional-components mediante la versión de la imagen 1.5 o posterior.

gcloud beta dataproc clusters create cluster-name \
    --optional-components=HBASE,ZOOKEEPER \
    --region=region \
    --image-version=1.5 \
    --enable-component-gateway \
    ... other flags

API de REST

HBase y los componentes de Zookeeper necesarios se pueden especificar a través de la API de Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.

Console

En este momento, Cloud Console no admite la creación de un clúster con el componente opcional de HBase.

Configura las propiedades de configuración de HBase

Aunque la configuración predeterminada de HBase de Dataproc debería ser suficiente para la mayoría de las aplicaciones, puedes modificar la configuración de HBase cuando crees propiedades de clústeres mediante el archivo hbase:.

Ejemplo del comando de gcloud para configurar hbase.rootdir como hbase-site.xml:

gcloud beta dataproc clusters create my-cluster \
    --optional-components=HBASE,ZOOKEEPER \
    --properties=hbase:hbase.rootdir=hdfs://...
    ... other flags (see Installing the component)