Se usó la API de Cloud Translation para traducir esta página.

Componente opcional de HBase de Dataproc

La instalación del componente opcional de HBase se limita a los clústeres de Dataproc creados con la versión de imagen 1.5 o 2.0.

Si bien Google Cloud proporciona muchos servicios que te permiten implementar Apache HBase autoadministrado, Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de cargas de trabajo. Las tablas de la base de datos de HBase se pueden migrar a Bigtable para administrar los datos subyacentes, mientras que las aplicaciones que antes interoperaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, proporcionamos los pasos generales para comenzar a usar Bigtable y referencias para migrar datos a Bigtable desde implementaciones de HBase de Dataproc.

Comienza a usar Bigtable

Cloud Bigtable es una plataforma NoSQL de alto rendimiento y gran capacidad de procesamiento que proporciona compatibilidad con el cliente de la API de Apache HBase y portabilidad para las cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase y se puede incluir en la aplicación existente para leer y escribir en Bigtable. Las aplicaciones de HBase existentes pueden agregar la biblioteca cliente de HBase de Bigtable para leer y escribir datos almacenados en Bigtable.

Consulta Bigtable y la API de HBase para obtener más información sobre cómo configurar tu aplicación de HBase con Bigtable.

Crea un clúster de Bigtable

Para comenzar a usar Bigtable, crea un clúster y tablas para almacenar datos que antes se almacenaban en HBase. Sigue los pasos que se indican en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para la creación automatizada de tablas a partir de DDL de tablas de HBase, consulta la herramienta de traducción de esquemas.

Abre la instancia de Bigtable en la Google Cloud consola para ver la tabla y los gráficos de supervisión del servidor, incluidas las filas por segundo, la latencia y el rendimiento, para administrar la tabla aprovisionada recientemente. Para obtener más información, consulta Supervisión.

Migra datos de Dataproc a Bigtable

Después de crear las tablas en Bigtable, puedes importar y validar tus datos siguiendo las instrucciones en Migra HBase en Google Cloud a Bigtable. Después de migrar los datos, puedes actualizar las aplicaciones para que envíen lecturas y escrituras a Bigtable.

¿Qué sigue?

Consulta los ejemplos de Wordcount de Spark para ejecutar Spark con Bigtable.
Revisa las opciones de migración en línea con la replicación en vivo de HBase a Bigtable.
Mira Cómo Box modernizó sus bases de datos NoSQL para comprender otros beneficios.