La instalación del componente opcional de HBase se limita a los clústeres de Dataproc creados con la versión de la imagen 1.5 o 2.0.
Si bien Google Cloud proporciona muchos servicios que te permiten implementar Apache HBase con administración automática, Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de cargas de trabajo. Las tablas de la base de datos de HBase se pueden migrar a Bigtable para administrar los datos subyacentes, mientras que las aplicaciones que antes interoperaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, proporcionamos los pasos generales para comenzar a usar Bigtable y referencias para migrar datos a Bigtable desde implementaciones de HBase de Dataproc.
Comienza a usar Bigtable
Cloud Bigtable es una plataforma NoSQL altamente escalable y de alto rendimiento que proporciona compatibilidad con clientes de la API de Apache HBase y portabilidad para cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase y se puede incluir con la aplicación existente para leer y escribir en Bigtable. Las aplicaciones de HBase existentes pueden agregar la biblioteca cliente de HBase de Bigtable para leer y escribir datos almacenados en Bigtable.
Consulta Bigtable y la API de HBase para obtener más información sobre cómo configurar tu aplicación de HBase con Bigtable.
Crea un clúster de Bigtable
Para comenzar a usar Bigtable, crea un clúster y tablas para almacenar los datos que se almacenaban anteriormente en HBase. Sigue los pasos que se indican en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para la creación automática de tablas a partir de DDL de tablas de HBase, consulta la herramienta de traductor de esquemas.
Abre la instancia de Bigtable en la consola de Google Cloud para ver la tabla y los gráficos de supervisión del servidor, incluidas las filas por segundo, la latencia y la capacidad de procesamiento, para administrar la tabla aprovisionada recientemente. Para obtener más información, consulta Supervisión.
Migra datos de Dataproc a Bigtable
Después de crear las tablas en Bigtable, puedes importar y validar tus datos siguiendo las instrucciones que se indican en Cómo migrar HBase en Google Cloud a Bigtable. Después de migrar los datos, puedes actualizar las aplicaciones para enviar operaciones de lectura y escritura a Bigtable.
¿Qué sigue?
- Consulta los ejemplos de Wordcount de Spark para ejecutar Spark con Bigtable.
- Revisa las opciones de migración en línea con la replicación en vivo de HBase a Bigtable.
- Mira el video Cómo Box modernizó sus bases de datos NoSQL para comprender otros beneficios.