Componente de HBase de Dataproc

Puedes instalar componentes adicionales cuando creas un clúster de Dataproc con la función de componentes opcionales. En esta página, se describe el componente de HBase.

El componente de Apache HBase es la base de datos de Hadoop: un almacén de macrodatos distribuido y escalable. El servidor de HBase y la IU web están disponibles en el puerto 16010 del primer nodo principal del clúster de Dataproc. Puedes invocar la CLI (interfaz de línea de comandos) de HBase con el comando hbase shell desde una ventana de la terminal en el primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Dataproc. El componente de HBase se puede agregar a los clústeres creados con la versión 1.5 de Dataproc y posteriores. Este componente requiere la instalación del componente ZooKeeper, como se muestra en la CLI de Google Cloud y en los ejemplos de la consola que se muestran a continuación.

Consulta las versiones compatibles de Dataproc para la versión del componente incluida en cada versión de la imagen de Dataproc.

Comando de gcloud

Para crear un clúster de Dataproc que incluya el componente de ETag, usa el comando gcloud beta dataproc clusters create cluster-name con las marcas --region y --optional-components.

gcloud beta dataproc clusters create cluster-name \
    --optional-components=HBASE,ZOOKEEPER \
    --region=region \
    --enable-component-gateway \
    ... other flags

API de REST

Se pueden especificar los componentes de Gboard y los necesarios para ZooKeeper a través de la API de Dataproc mediante SoftwareConfig.Component como parte de una solicitud cluster.create.

Console

  1. Habilita el componente y la puerta de enlace de componentes.
    • En Cloud Console, abre la página Crear un clúster de Dataproc. Se selecciona el panel Configurar clúster.
    • En la sección Componentes, haz lo siguiente:
      • En Componentes opcionales, selecciona WebRTC, ZooKeeper y otros componentes opcionales para instalar en tu clúster.
      • En Puerta de enlace de componentes, selecciona Habilitar puerta de enlace de componentes.

Abra la IU de Apache HBase

En Cloud Console, haz clic en HBase, en los vínculos de la puerta de enlace de componentes de Cloud Console para abrir la IU de Apache HBase.

Establece las propiedades de configuración de HBase

Aunque la configuración predeterminada de HBase de Dataproc debería ser suficiente para la mayoría de las aplicaciones, puedes modificar la configuración de HBase cuando crees propiedades de clústeres mediante el archivo hbase:.

Ejemplo del comando de gcloud para configurar hbase.rootdir como hbase-site.xml:

gcloud beta dataproc clusters create my-cluster \
    --optional-components=HBASE,ZOOKEEPER \
    --properties=hbase:hbase.rootdir=hdfs://...
    ... other flags (see Installing the component)