Bigtable con Dataproc

Bigtable es el servicio de base de datos NoSQL de Google para trabajar con macrodatos. Es la misma base de datos que utilizan muchos de los servicios principales de Google, como la Búsqueda, Analytics, Maps y Gmail. Bigtable se diseñó para manejar cargas de trabajo enormes con baja latencia y alta capacidad de procesamiento de forma coherente, por lo que es una excelente opción para aplicaciones operativas y analíticas, como IoT, estadísticas de usuarios y análisis de datos financieros.

Bigtable es una opción excelente para cualquier uso de Apache Spark o Hadoop que requiera Apache HBase. Bigtable admite las APIs de Apache HBase 1.0 y 2.0, y ofrece un cliente de Bigtable HBase en Maven para usar Bigtable con Dataproc.

Usa el conector de Bigtable Spark

El conector de Bigtable Spark te permite leer y escribir datos desde y hacia Bigtable. Puedes leer datos desde tu aplicación de Spark con Spark SQL y DataFrames. Para trabajos de solo lectura, puedes usar la computación sin servidores de Data Boost (versión preliminar). Data Boost está diseñado para los requisitos de rendimiento de las consultas y los trabajos de alta capacidad de procesamiento, y te permite evitar afectar el tráfico del clúster que entrega la aplicación cuando se ejecutan esas consultas y trabajos.

Para obtener más información, consulta Cómo usar el conector de Bigtable Spark.

¿Qué sigue?

  • Para obtener más información sobre el uso de Bigtable, consulta la documentación de Bigtable.