Bigtable com Dataproc

O Bigtable é o serviço de base de dados de Big Data NoSQL da Google. É a mesma base de dados que alimenta muitos serviços Google essenciais, incluindo a Pesquisa, o Analytics, o Maps e o Gmail. O Bigtable foi concebido para processar cargas de trabalho massivas com uma latência baixa consistente e um débito elevado, pelo que é uma excelente escolha para aplicações operacionais e analíticas, incluindo IoT, estatísticas de utilizadores e análise de dados financeiros.

O Bigtable é uma excelente opção para quaisquer utilizações do Apache Spark ou Hadoop que exijam o Apache HBase. O Bigtable suporta as APIs Apache HBase 1.0+ e 2.0+ e oferece um cliente HBase do Bigtable no Maven para usar o Bigtable com o Dataproc.

Use o conetor do Bigtable Spark

O conetor do Bigtable Spark permite-lhe ler e escrever dados do Bigtable. Pode ler dados na sua aplicação Spark através do Spark SQL e dos DataFrames. Para tarefas de leitura, pode usar a computação sem servidor do Data Boost. O Data Boost foi concebido para os requisitos de desempenho de tarefas e consultas de elevado débito, e permite-lhe evitar o impacto no tráfego do cluster de publicação de aplicações quando essas tarefas e consultas são executadas.

Para mais informações, consulte o artigo Use o conetor do Bigtable Spark.

O que se segue?

  • Para mais informações sobre a utilização do Bigtable, consulte a documentação do Bigtable.