Bigtable com o Dataproc

O Bigtable é o serviço de banco de dados Big Data NoSQL do Google. É o mesmo banco de dados usado em vários serviços principais do Google, como Pesquisa, Analytics, Maps e Gmail. O Bigtable foi projetado para processar cargas de trabalho enormes com baixa latência consistente e alta capacidade. Por isso, ele é uma ótima escolha para aplicativos operacionais e analíticos, incluindo IoT, análise de usuários e análise de dados financeiros.

O Bigtable é uma excelente opção para qualquer uso do Apache Spark ou do Hadoop que exija o Apache HBase. O Bigtable é compatível com as APIs 1.0 e 2.0 do Apache HBase e oferece um cliente HBase Bigtable no Maven para usar o Bigtable com o Dataproc.

Usar o conector do Bigtable Spark

O conector do Bigtable Spark permite ler e gravar dados do e para o Bigtable. É possível ler dados no seu aplicativo Spark usando o Spark SQL e os DataFrames. Para jobs somente leitura, use a computação sem servidor do Data Boost (pré-lançamento). O Data Boost foi projetado para atender aos requisitos de performance de jobs e consultas de alta capacidade de processamento. Ele evita o impacto no tráfego do cluster que serve o aplicativo quando esses jobs e consultas são executados.

Para mais informações, consulte Usar o conector do Bigtable Spark.

A seguir

  • Para mais informações sobre como usar o Bigtable, consulte a documentação do Bigtable.