Integrazioni con Bigtable

Questa pagina descrive le integrazioni tra Bigtable e altri prodotti e servizi.

Servizi Google Cloud

Questa sezione descrive i servizi Google Cloud con cui si integra Bigtable.

BigQuery

BigQuery è il data warehouse di analisi di Google completamente gestito, a basso costo e su scala petabyte. Puoi utilizzare BigQuery con Bigtable per i seguenti scopi:

  • Puoi creare una tabella BigQuery esterna e utilizzarla per eseguire query sulla tabella Bigtable e unire i dati ad altre tabelle BigQuery. Per maggiori informazioni, vedi Dati Bigtable BigQuery.

  • Puoi esportare i tuoi dati BigQuery in una tabella Bigtable utilizzando ETL (RETL) inverso da BigQuery a Bigtable. Per maggiori informazioni, vedi Esportare i dati in Bigtable (Anteprima).

Cloud Asset Inventory

Cloud Asset Inventory, che fornisce servizi di inventario basati su un database di serie temporali, supporta e restituisce i tipi di risorse Bigtable. Per un elenco completo, vedi Tipi di risorse supportati.

Data Catalog

Data Catalog è una funzionalità di Dataplex che cataloga automaticamente i metadati sulle risorse Bigtable. Le informazioni di Data Catalog sui tuoi dati possono semplificare l'analisi, il riutilizzo dei dati, lo sviluppo di applicazioni e la gestione dei dati. Per scoprire di più, consulta Gestire gli asset di dati utilizzando Data Catalog.

Dataflow

Dataflow è un servizio cloud e un modello di programmazione per l'elaborazione dei big data. Dataflow supporta l'elaborazione sia in batch che in flussi. Puoi utilizzare Dataflow per elaborare i dati archiviati in Bigtable o per archiviare l'output della tua pipeline Dataflow. Puoi utilizzare i modelli Dataflow anche per esportare e import i tuoi dati come Avro, Parquet o SequenceFiles.

Per iniziare, consulta la sezione Connettore Bigtable Beam.

Puoi anche utilizzare Bigtable come ricerca di coppie chiave-valore per arricchire i dati in una pipeline. Per una panoramica, vedi Arricchire i dati in modalità flusso. Per un tutorial, vedi Utilizzare Apache Beam e Bigtable per arricchire i dati.

Dataproc

Dataproc fornisce Apache Hadoop e i prodotti correlati come servizio gestito nel cloud. Con Dataproc, puoi eseguire job Hadoop che leggono e scrivono in Bigtable.

Per un esempio di job Hadoop MapReduce che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Vertex AI Vector Search è una tecnologia che può eseguire ricerche da miliardi di elementi semanticamente simili o semanticamente correlati. È utile per implementare motori per suggerimenti, chatbot e classificazione del testo.

Puoi utilizzare Bigtable per archiviare incorporamenti vettoriali, esportarli in un indice di Vector Search ed eseguire query sull'indice per elementi simili. Per un tutorial che dimostra un flusso di lavoro di esempio, consulta Esportazione da Bigtable a Vertex AI Vector Search nel repository GitHub di workflows-demos.

Big data

Questa sezione descrive i prodotti per big data con cui si integra Bigtable.

Apache Beam

Apache Beam è un modello unificato per definire le pipeline di elaborazione parallela dei dati in modalità batch e flusso. Il connettore Bigtable Beam (BigtableIO) consente di eseguire operazioni in batch e in flussi sui dati Bigtable in una pipeline.

Per un tutorial che mostra come utilizzare il connettore Bigtable Beam per eseguire il deployment di una pipeline di dati in Dataflow, consulta Elaborare un flusso di modifiche Bigtable.

Apache Hadoop

Apache Hadoop è un framework che consente l'elaborazione distribuita di grandi set di dati tra cluster di computer. Puoi utilizzare Dataproc per creare un cluster Hadoop, quindi eseguire job MapReduce che leggono e scrivono su Bigtable.

Per un esempio di job Hadoop MapReduce che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Raccoglitore dati StreamSet

Il raccoglitore dati di StreamSets è un'applicazione di flusso di dati che puoi configurare per scrivere dati in Bigtable. StreamSets fornisce una libreria Bigtable nel suo repository GitHub all'indirizzo streamsets/datacollector.

Database a grafo

Questa sezione descrive i database di grafici con cui si integra Bigtable.

HGraphDB

HGraphDB è un livello client per l'utilizzo di Apache HBase o Bigtable come database di grafici. Implementa le interfacce Apache TinkerPop 3.

Per ulteriori informazioni sull'esecuzione di HGraphDB con il supporto Bigtable, consulta la documentazione di HGraphDB.

JanusGraph

JanusGraph è un database di grafici scalabile. È ottimizzato per l'archiviazione e l'esecuzione di query su grafici contenenti centinaia di miliardi di vertici e bordi.

Per ulteriori informazioni sull'esecuzione di JanusGraph con il supporto Bigtable, consulta la pagina relativa all'esecuzione di JanusGraph con Bigtable o la documentazione di JanusGraph.

Gestione dell'infrastruttura

Questa sezione descrive gli strumenti di gestione dell'infrastruttura con cui si integra Bigtable.

Pivotal Cloud Foundry

Pivotal Cloud Foundry è una piattaforma per lo sviluppo e il deployment di applicazioni che offre la possibilità di associare un'applicazione a Bigtable.

Terraform

Terraform è uno strumento open source che codifica le API in file di configurazione dichiarativi. Questi file possono essere condivisi tra i membri del team, trattati come codice, modificati, rivisti e sottoposti al controllo delle versioni.

Per ulteriori informazioni sull'utilizzo di Bigtable con Terraform, vedi Bigtable Instance e Bigtable Table nella documentazione Terraform.

Database di serie temporali e monitoraggio

Questa sezione descrive i database di serie temporali e gli strumenti di monitoraggio con cui si integra Bigtable.

Eroica

Heroic è un sistema di monitoraggio e un database di serie temporali. Heroic può usare Bigtable per archiviare i suoi dati.

Per maggiori informazioni su Heroic, consulta il repository GitHub spotify/heroic, nonché la documentazione per la configurazione di Bigtable e la configurazione delle metriche.

OpenTSDB

OpenTSDB è un database di serie temporali che può utilizzare Bigtable per l'archiviazione. La documentazione di OpenTSDB fornisce informazioni per aiutarti a iniziare.