Componente opcional de HBase de Dataproc

La instalación del componente opcional de HBase se limita a los clústeres de Dataproc creados con la versión de la imagen 1.5 o 2.0.

Si bien Google Cloud proporciona muchos servicios que te permiten implementar Apache HBase con administración automática, Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de cargas de trabajo. Las tablas de la base de datos de HBase se pueden migrar a Bigtable para administrar los datos subyacentes, mientras que las aplicaciones que antes interoperaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, proporcionamos los pasos generales para comenzar a usar Bigtable y referencias para migrar datos a Bigtable desde implementaciones de HBase de Dataproc.

Comienza a usar Bigtable

Cloud Bigtable es una plataforma NoSQL altamente escalable y de alto rendimiento que proporciona compatibilidad con clientes de la API de Apache HBase y portabilidad para cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase y se puede incluir con la aplicación existente para leer y escribir en Bigtable. Las aplicaciones de HBase existentes pueden agregar la biblioteca cliente de HBase de Bigtable para leer y escribir datos almacenados en Bigtable.

Consulta Bigtable y la API de HBase para obtener más información sobre cómo configurar tu aplicación de HBase con Bigtable.

Crea un clúster de Bigtable

Para comenzar a usar Bigtable, crea un clúster y tablas para almacenar los datos que se almacenaban anteriormente en HBase. Sigue los pasos que se indican en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para la creación automática de tablas a partir de DDL de tablas de HBase, consulta la herramienta de traductor de esquemas.

Abre la instancia de Bigtable en la consola de Google Cloud para ver la tabla y los gráficos de supervisión del servidor, incluidas las filas por segundo, la latencia y la capacidad de procesamiento, para administrar la tabla aprovisionada recientemente. Para obtener más información, consulta Supervisión.

Migra datos de Dataproc a Bigtable

Después de crear las tablas en Bigtable, puedes importar y validar tus datos siguiendo las instrucciones que se indican en Cómo migrar HBase en Google Cloud a Bigtable. Después de migrar los datos, puedes actualizar las aplicaciones para enviar operaciones de lectura y escritura a Bigtable.

¿Qué sigue?