Integrações com o Bigtable
Esta página descreve as integrações entre o Bigtable e outros produtos e serviços.
Google Cloud serviços
Esta secção descreve os serviços do Google Cloud com os quais o Bigtable se integra.
BigQuery
O BigQuery é o armazém de dados de estatísticas de baixo custo, com capacidade para petabytes de dados e totalmente gerido da Google. Pode usar o BigQuery com o Bigtable para os seguintes fins:
Pode criar uma tabela externa do BigQuery e, em seguida, usá-la para consultar a sua tabela do Bigtable e juntar os dados a outras tabelas do BigQuery. Para mais informações, consulte o artigo Consultar dados do Bigtable.
Pode exportar os seus dados do BigQuery para uma tabela do Bigtable usando o ETL inverso (RETL) do BigQuery para o Bigtable. Para mais informações, consulte o artigo Exporte dados para o Bigtable.
Cloud Asset Inventory
O Cloud Asset Inventory, que fornece serviços de inventário com base numa base de dados de séries cronológicas, suporta e devolve tipos de recursos do Bigtable. Para ver uma lista completa, consulte o artigo Tipos de recursos suportados.
Dataplex Universal Catalog
O catálogo universal do Dataplex e o catálogo de dados (descontinuado) catalogam automaticamente os metadados sobre os recursos do Bigtable. As informações catalogadas sobre os seus dados podem ajudar a facilitar a análise, a reutilização de dados, o desenvolvimento de aplicações e a gestão de dados. Para mais informações, consulte o artigo Faça a gestão de recursos de dados através do catálogo de dados.
Dataflow
O Dataflow é um serviço na nuvem e um modelo de programação para o processamento de big data. O Dataflow suporta o processamento em lote e por streaming. Pode usar o Dataflow para processar dados armazenados no Bigtable ou para armazenar o resultado do pipeline do Dataflow. Também pode usar modelos do Dataflow para exportar e importar os seus dados como ficheiros Avro, Parquet ou SequenceFiles.
Para começar, consulte o conetor Bigtable Beam.
Também pode usar o Bigtable como uma pesquisa de chave-valor para enriquecer os dados num pipeline. Para uma vista geral, consulte o artigo Enriqueça os dados de streaming. Para ver um tutorial, consulte Use o Apache Beam e o Bigtable para enriquecer os dados.
Dataproc
O Dataproc fornece o Apache Hadoop e produtos relacionados como um serviço gerido na nuvem. Com o Dataproc, pode executar tarefas do Hadoop que leiam e escrevam no Bigtable.
Para ver um exemplo de uma tarefa Hadoop MapReduce que usa o Bigtable, consulte o diretório /java/dataproc-wordcount
no repositório do GitHub GoogleCloudPlatform/cloud-bigtable-examples.
Vertex AI Vector Search
A Vertex AI Vector Search é uma tecnologia que pode pesquisar entre milhares de milhões de itens semanticamente semelhantes ou semanticamente relacionados. É útil para implementar motores de recomendações, chatbots e classificação de texto.
Pode usar o Bigtable para armazenar incorporações de vetores, exportá-las para um índice de pesquisa vetorial e, em seguida, consultar o índice para encontrar itens semelhantes. Para ver um tutorial que demonstra um fluxo de trabalho de exemplo, consulte o artigo Bigtable para
exportação do Vertex AI Vector Search no repositório do
workflows-demos
GitHub.
Também pode enviar atualizações de streaming para manter o índice de pesquisa vetorial sincronizado com o Bigtable em tempo real. Para mais informações, consulte o modelo de streams de alterações do Bigtable para a pesquisa vetorial.
Grande volume de dados
Esta secção descreve os produtos de Big Data com os quais o Bigtable se integra.
Apache Beam
O Apache Beam é um modelo unificado para definir pipelines de processamento em paralelo de dados em lote e por streaming. O
conetor do Bigtable Beam (BigtableIO
)
ajuda a executar operações em lote e por streaming em dados do Bigtable
num pipeline.
Para ver um tutorial que mostra como usar o conetor Bigtable Beam para implementar um pipeline de dados no Dataflow, consulte o artigo Processe um fluxo de alterações do Bigtable.
Apache Hadoop
O Apache Hadoop é uma estrutura que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores. Pode usar o Dataproc para criar um cluster Hadoop e, em seguida, executar tarefas MapReduce que leiam e escrevam no Bigtable.
Para ver um exemplo de uma tarefa Hadoop MapReduce que usa o Bigtable, consulte o diretório /java/dataproc-wordcount
no repositório do GitHub GoogleCloudPlatform/cloud-bigtable-examples.
StreamSets Data Collector
O StreamSets Data Collector é uma aplicação de streaming de dados que pode configurar para escrever dados no Bigtable. A StreamSets fornece uma biblioteca do Bigtable no respetivo repositório do GitHub em streamsets/datacollector.
Bases de dados de grafos
Esta secção descreve as bases de dados de grafos com as quais o Bigtable se integra.
HGraphDB
O HGraphDB é uma camada de cliente para usar o Apache HBase ou o Bigtable como uma base de dados de grafos. Implementa as interfaces Apache TinkerPop 3.
Para mais informações sobre a execução do HGraphDB com apoio técnico do Bigtable, consulte a documentação do HGraphDB.
JanusGraph
O JanusGraph é uma base de dados de grafos escalável. Está otimizado para armazenar e consultar gráficos que contêm centenas de milhares de milhões de vértices e arestas.
Para mais informações sobre a execução do JanusGraph com suporte do Bigtable, consulte o artigo Executar o JanusGraph com o Bigtable ou a documentação do JanusGraph.
Gestão de infraestruturas
Esta secção descreve as ferramentas de gestão de infraestrutura com as quais o Bigtable se integra.
Pivotal Cloud Foundry
O Pivotal Cloud Foundry é uma plataforma de programação e implementação de aplicações que oferece a capacidade de associar uma aplicação ao Bigtable.
Terraform
O Terraform é uma ferramenta de código aberto que codifica APIs em ficheiros de configuração declarativos. Estes ficheiros podem ser partilhados entre os membros da equipa, tratados como código, editados, revistos e controlados por versões.
Para mais informações sobre a utilização do Bigtable com o Terraform, consulte os artigos Instância do Bigtable e Tabela do Bigtable na documentação do Terraform.
Bases de dados de intervalos temporais e monitorização
Esta secção descreve as bases de dados de séries cronológicas e as ferramentas de monitorização com as quais o Bigtable se integra.
OpenTSDB
O OpenTSDB é uma base de dados de séries cronológicas que pode usar o Bigtable para armazenamento. A documentação do OpenTSDB fornece informações para ajudar a começar.