Bigtable con Dataproc

Bigtable es el servicio de base de datos NoSQL de Google para trabajar con macrodatos. Es la misma base de datos que utilizan muchos de los servicios centrales de Google, como Búsqueda, Analytics, Maps y Gmail. Bigtable se diseñó para pueden manejar cargas de trabajo masivas con baja latencia y alta capacidad de procesamiento una excelente opción para aplicaciones operativas y analíticas, como IoT, análisis de usuarios y análisis de datos financieros.

Bigtable es una opción excelente para cualquier uso de Apache Spark o Hadoop que requiera Apache HBase. Bigtable admite las APIs de Apache HBase 1.0 y 2.0, y ofrece un cliente de Bigtable HBase en Maven para usar Bigtable con Dataproc.

Usa el conector de Spark de Bigtable

El conector de Bigtable para Spark te permite leer y escribir datos desde y hacia Bigtable. Puedes leer datos de tu instancia de Spark una aplicación con Spark SQL y DataFrames. Para trabajos de solo lectura, puedes usar la computación sin servidores de Data Boost (versión preliminar). Data Boost está diseñado para los requisitos de rendimiento de las consultas y los trabajos de alta capacidad de procesamiento, y te permite evitar afectar el tráfico del clúster que entrega la aplicación cuando se ejecutan esas consultas y trabajos.

Para obtener más información, consulta Usa Bigtable de Bigtable conector.

¿Qué sigue?

  • Para obtener más información sobre el uso de Bigtable, consulta el Bigtable.