La instalación del componente opcional de HBase se limita a los clústeres de Dataproc creados con las versiones de imagen 1.5 o 2.0.
Si bien Google Cloud proporciona muchos servicios que te permiten implementar Apache HBase autoadministrado, Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de cargas de trabajo. Las tablas de base de datos de HBase se pueden migrar a Bigtable para administrar los datos subyacentes, mientras que las aplicaciones que antes operaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, proporcionamos los pasos de alto nivel para comenzar a usar Bigtable y referencias para migrar datos a Bigtable desde implementaciones de HBase en Dataproc.
Comienza a usar Bigtable
Cloud Bigtable es una plataforma NoSQL altamente escalable y de alto rendimiento que proporciona compatibilidad con clientes con la API de Apache HBase y portabilidad para las cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase, y se puede incluir en la aplicación existente para leer y escribir en Bigtable. Las aplicaciones existentes de HBase pueden agregar la biblioteca cliente de Bigtable HBase para leer y escribir datos almacenados en Bigtable.
Consulta Bigtable y la API de HBase si quieres obtener más información para configurar la aplicación de HBase con Bigtable.
Crea un clúster de Bigtable
Para comenzar a usar Bigtable, crea un clúster y tablas para almacenar datos que se almacenaron previamente en HBase. Sigue los pasos en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para la creación automatizada de tablas a partir de los DDL de tablas de HBase, consulta la herramienta traductor de esquemas.
Abre la instancia de Bigtable en la consola de Google Cloud para ver los gráficos de supervisión del lado del servidor y de la tabla, que incluyen filas por segundo, latencia y capacidad de procesamiento, y así administrar la tabla recién aprovisionada. Para obtener información adicional, consulta Supervisión.
Migra datos de Dataproc a Bigtable
Después de crear las tablas en Bigtable, puedes importar y validar tus datos siguiendo las instrucciones en Cómo migrar HBase en Google Cloud a Bigtable. Después de migrar los datos, puedes actualizar las aplicaciones para enviar operaciones de lectura y escritura a Bigtable.
¿Qué sigue?
- Consulta ejemplos de Spark de Wordcount para ejecutar Spark con Bigtable.
- Revisa las opciones de migración en línea con la replicación en vivo de HBase a Bigtable.
- Mira el video Cómo Box modernizó sus bases de datos NoSQL para conocer otros beneficios.