Componente opcional de HBase de Dataproc

La instalación del componente opcional de HBase se limita a los clústeres de Dataproc creados con las versiones de imagen 1.5 o 2.0.

Si bien Google Cloud proporciona muchos servicios que te permiten implementar Apache HBase autoadministrado, Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de cargas de trabajo. Las tablas de base de datos de HBase se pueden migrar a Bigtable para administrar los datos subyacentes, mientras que las aplicaciones que antes operaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, proporcionamos los pasos de alto nivel para comenzar a usar Bigtable y referencias para migrar datos a Bigtable desde implementaciones de HBase en Dataproc.

Comienza a usar Bigtable

Cloud Bigtable es una plataforma NoSQL altamente escalable y de alto rendimiento que proporciona compatibilidad con clientes con la API de Apache HBase y portabilidad para las cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase, y se puede incluir en la aplicación existente para leer y escribir en Bigtable. Las aplicaciones existentes de HBase pueden agregar la biblioteca cliente de Bigtable HBase para leer y escribir datos almacenados en Bigtable.

Consulta Bigtable y la API de HBase si quieres obtener más información para configurar la aplicación de HBase con Bigtable.

Crea un clúster de Bigtable

Para comenzar a usar Bigtable, crea un clúster y tablas para almacenar datos que se almacenaron previamente en HBase. Sigue los pasos en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para la creación automatizada de tablas a partir de los DDL de tablas de HBase, consulta la herramienta traductor de esquemas.

Abre la instancia de Bigtable en la consola de Google Cloud para ver los gráficos de supervisión del lado del servidor y de la tabla, que incluyen filas por segundo, latencia y capacidad de procesamiento, y así administrar la tabla recién aprovisionada. Para obtener información adicional, consulta Supervisión.

Migra datos de Dataproc a Bigtable

Después de crear las tablas en Bigtable, puedes importar y validar tus datos siguiendo las instrucciones en Cómo migrar HBase en Google Cloud a Bigtable. Después de migrar los datos, puedes actualizar las aplicaciones para enviar operaciones de lectura y escritura a Bigtable.

¿Qué sigue?