Componente opcional de HBase de Dataproc

Puedes instalar componentes adicionales, como HBase, cuando creas un clúster de Dataproc con la función de componentes opcionales en la versión 1.5 de Dataproc o la versión 2.0 de Dataproc. Sin embargo, el componente de Apache HBase no se recomienda para su uso en Dataproc debido a la naturaleza efímera de los clústeres de Dataproc.

Si bien Google Cloud proporciona muchos servicios que te permiten implementar Apache HBase autoadministrado, Cloud Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de carga de trabajo. Las tablas de la base de datos de HBase se pueden migrar a Bigtable para administrar los datos subyacentes, mientras que las aplicaciones que antes funcionaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, se proporcionan los pasos de alto nivel para comenzar a usar Bigtable y se proporcionan referencias a fin de migrar datos a Bigtable desde las implementaciones de HBase de Dataproc.

Comienza a usar Bigtable

Cloud Bigtable es una plataforma NoSQL altamente escalable y de buen rendimiento que proporciona compatibilidad y compatibilidad de cliente de la API de Apache HBase para las cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase y se puede incluir con la aplicación existente para leer y escribir en Bigtable. Las aplicaciones existentes de HBase pueden agregar la biblioteca cliente HBase de Bigtable para leer y escribir datos almacenados en Bigtable.

Consulta Bigtable y la API de HBase para obtener más información sobre cómo configurar tu aplicación de HBase con Bigtable.

Crear un clúster de Bigtable

A fin de comenzar a usar Bigtable, crea un clúster y tablas para almacenar los datos almacenados antes en HBase. Sigue los pasos en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para la creación automatizada de tablas desde DDL de tablas de HBase, consulta la herramienta del traductor de esquemas.

Abre la instancia de Bigtable en Google Cloud Console para ver la tabla y los gráficos de supervisión del lado del servidor, incluidas las filas por segundo, la latencia y la capacidad de procesamiento, a fin de administrar la tabla recién aprovisionada. Para obtener información adicional, consulta Supervisión.

Migrar datos de Dataproc a Bigtable

Después de crear las tablas en Bigtable, puedes importar y validar tus datos mediante las instrucciones de Migra HBase en Google Cloud a Bigtable. Después de migrar los datos, puedes actualizar las aplicaciones para enviar lecturas y escrituras a Bigtable.

¿Qué sigue?