Integrações com o Cloud Bigtable

Nesta página, descrevemos as integrações entre o Cloud Bigtable e outros produtos e serviços.

Serviços do Google Cloud

Nesta seção, descrevemos os serviços do Google Cloud com que o Cloud Bigtable se integra.

BigQuery

BigQuery é o serviço de armazenamento de dados para análise de baixo custo, totalmente gerenciado e com escala em petabyte, desenvolvido pelo Google. Use o BigQuery para consultar dados armazenados no Cloud Bigtable.

Para começar, consulte Como consultar dados do Cloud Bigtable.

Cloud Functions

Cloud Functions é uma plataforma de computação sem servidor com base em eventos que se integra ao Cloud Bigtable.

Para ver um aplicativo Node.js de amostra que usa o Pub/Sub para acionar um Cloud Functions que grava no Cloud Bigtable, consulte o repositório de exemplos no GitHub (em inglês).

Dataflow

O Dataflow é um serviço em nuvem e um modelo de programação para processamento de Big Data. O Dataflow é compatível com processamento em lote e de stream. Use o Dataflow para processar dados armazenados no Cloud Bigtable ou armazenar a saída do pipeline do Dataflow. Também é possível usar modelos do Dataflow para exportar e importar seus dados como arquivos Avro ou SequenceFiles.

Para começar, consulte Conector do Dataflow para o Cloud Bigtable.

Dataproc

O Dataproc fornece o Apache Hadoop e produtos relacionados como um serviço gerenciado na nuvem. Com o Dataproc, é possível executar jobs do Hadoop que leem do e gravam no Cloud Bigtable.

Veja um exemplo de job de MapReduce do Hadoop que usa o Cloud Bigtable no diretório /java/dataproc-wordcount no repositório do GitHub GoogleCloudPlatform/cloud-bigtable-examples (em inglês).

Cloud Deployment Manager

O Deployment Manager é um serviço de implantação de infraestrutura que automatiza a criação e o gerenciamento de recursos do Google Cloud. Ele faz chamadas de API para criar instâncias do Cloud Bigtable e as adiciona à sua implantação.

Big Data

Nesta seção, descrevemos os produtos do Big Data que estão integrados ao Cloud Bigtable.

Apache Hadoop

O Apache Hadoop (em inglês) é uma biblioteca que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores. Você usa o Dataproc para criar um cluster do Hadoop e executar jobs do MapReduce que leem do e gravam no Cloud Bigtable.

Veja um exemplo de job de MapReduce do Hadoop que usa o Cloud Bigtable no diretório /java/dataproc-wordcount no repositório do GitHub GoogleCloudPlatform/cloud-bigtable-examples (em inglês).

StreamSets Data Collector

O StreamSets Data Collector é um aplicativo de streaming de dados que você configura para gravar dados no Cloud Bigtable(em inglês). O StreamSets fornece uma biblioteca do Cloud Bigtable no próprio repositório do GitHub em streamsets/datacollector(em inglês).

Bancos de dados geoespaciais

Nesta seção, descrevemos os bancos de dados geoespaciais que estão integrados ao Cloud Bigtable.

GeoMesa

GeoMesa (em inglês) é um banco de dados espaço-temporal distribuído que aceita manipulação de dados e consulta espacial. O GeoMesa pode usar o Cloud Bigtable para armazenar os próprios dados.

Para mais informações sobre como executar o GeoMesa de maneira compatível com o Cloud Bigtable, consulte a documentação do GeoMesa (em inglês).

Bancos de dados de gráficos

Nesta seção, descrevemos os bancos de dados de gráficos que estão integrados ao Cloud Bigtable.

HGraphDB

HGraphDB (em inglês) é uma camada do cliente para usar o Apache HBase ou o Cloud Bigtable como banco de dados de gráficos. Ele implementa as interfaces do Apache TinkerPop 3 (em inglês).

Para mais informações sobre como executar o HGraphDB de maneira compatível com o Cloud Bigtable, consulte a documentação do HGraphDB (em inglês).

JanusGraph

JanusGraph (em inglês) é um banco de dados de gráficos escalonável. Ele é otimizado para armazenar e consultar gráficos que contêm centenas de bilhões de vértices e bordas.

Para mais informações sobre como executar o JanusGraph de maneira compatível com o Cloud Bigtable, consulte esta página ou a documentação do JanusGraph (em inglês).

Gerenciamento de infraestrutura

Nesta seção, descrevemos as ferramentas de gerenciamento de infraestrutura que estão integradas ao Cloud Bigtable.

Pivotal Cloud Foundry

O Pivotal Cloud Foundry é uma plataforma de desenvolvimento e implantação de aplicativos que oferece a capacidade de vincular um aplicativo ao Cloud Bigtable(em inglês).

Terraform

O Terraform é uma ferramenta de código aberto que codifica as APIs em arquivos de configuração declarativos. Esses arquivos podem ser compartilhados entre os membros da equipe, tratados como código, editado, revisado e com controle de versão.

Para mais informações sobre como usar o Cloud Bigtable com o Terraform, consulte Instância do Cloud Bigtable e Tabela do Cloud Bigtable na documentação do Terraform (em inglês).

Machine learning

Feast

Feast é uma ferramenta de armazenamento de recursos de código aberto para machine learning, desenvolvida pelo Google Cloud e pelo GO-JEK, que pode usar o Cloud Bigtable como armazenamento de exibição.

TensorFlow

O TensorFlow, uma biblioteca de código aberto para computação numérica, oferece suporte nativo para o uso do Cloud Bigtable para armazenar e exibir dados de treinamento (em inglês). O tutorial Cloud Bigtable para streaming de dados está disponível para ajudá-lo a aprender a usar essa integração.

Monitoramento e bancos de dados de séries temporais

Esta seção descreve ferramentas de monitoramento e bancos de dados de séries temporais com as quais o Cloud Bigtable se integra.

Heroic

Heroic (em inglês) é um sistema de monitoramento e banco de dados de série temporal. O Heroic pode usar o Cloud Bigtable para armazenar os próprios dados.

Para mais informações sobre o Heroic, consulte o repositório spotify/heroic do GitHub e a documentação sobre como configurar o Cloud Bigtable e como configurar as métricas (links em inglês).

OpenTSDB

OpenTSDB é um banco de dados de série temporal. Com a biblioteca AsyncBigtable (em inglês), o OpenTSDB usa o Cloud Bigtable para armazenar os próprios dados.

Para mais informações sobre como executar o OpenTSDB de maneira compatível com o Cloud Bigtable, consulte a postagem do blog Pythian e a documentação do OpenTSDB (links em inglês). Além disso, consulte Como usar o OpenTSDB para monitorar dados de série temporal no Google Cloud para saber como usar o OpenTSDB em execução no Google Kubernetes Engine e o Cloud Bigtable para coletar, registrar e monitorar dados de série temporal.