Integrazioni con Bigtable

Questa pagina descrive le integrazioni tra Bigtable e altri prodotti e i servizi di machine learning.

Servizi Google Cloud

Questa sezione descrive i servizi Google Cloud Con l'integrazione di Bigtable.

BigQuery

BigQuery è il data warehouse di analisi di Google completamente gestito, a basso costo e con capacità di petabyte. Puoi utilizzare BigQuery con Bigtable per le seguenti finalità:

  • Puoi creare una tabella esterna BigQuery e utilizzarla per eseguire query sulla tabella Bigtable e unire i dati ad altre tabelle BigQuery. Per ulteriori informazioni, consulta la sezione Eseguire query sui dati Bigtable.

  • Puoi esportare i tuoi dati BigQuery in un utilizzando l'ETL inversa (RETL) da BigQuery Bigtable. Per ulteriori informazioni, vedi Esportare i dati in Bigtable.

Cloud Asset Inventory

Cloud Asset Inventory, che fornisce servizi di inventario basati su un database delle serie temporali, supporta e restituisce tipi di risorse Bigtable. Per un elenco completo, consulta Tipi di risorse supportati.

Data Catalog

Data Catalog è una funzionalità di Dataplex che cataloga automaticamente i metadati delle risorse Bigtable. Le informazioni di Data Catalog sui tuoi dati possono facilitare analisi, riutilizzo dei dati, sviluppo di applicazioni e gestione dei dati. Per maggiori informazioni informazioni, consulta Gestire gli asset di dati utilizzando Data Catalog.

Dataflow

Dataflow è un servizio cloud e un modello di programmazione per l'elaborazione dei big data. Dataflow supporta l'elaborazione sia in batch che in streaming. Puoi utilizzare Dataflow per elaborare i dati archiviati in Bigtable o per archiviare l'output della pipeline Dataflow. Puoi anche utilizzare i modelli Dataflow esportare e import come Avro, Parquet o SequenceFiles.

Per iniziare, consulta la sezione Connettore Bigtable Beam.

Puoi anche utilizzare Bigtable come ricerca chiave-valore per arricchire i dati in una pipeline. Per una panoramica, consulta Arricchire i dati streaming. Per un tutorial, vedi Utilizzare Apache Beam e Bigtable per arricchire i tuoi dati.

Dataproc

Dataproc fornisce Apache Hadoop e i prodotti correlati come servizio gestito nel cloud. Con Dataproc, puoi eseguire Job Hadoop che leggono e scrivono su Bigtable.

Per un esempio di un job Hadoop MapReduce che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Vertex AI Vector Search è una tecnologia che consente di eseguire ricerche tra miliardi di elementi semanticamente simili o semanticamente correlati. È utile per implementare motori per suggerimenti, chatbot e classificazione del testo.

Puoi utilizzare Bigtable per archiviare gli incorporamenti vettoriali, esportarli in un indice di ricerca vettoriale ed eseguire query sull'indice per trovare elementi simili. Per un tutorial che illustra un flusso di lavoro di esempio, vedi Bigtable per Esportazione di Vertex AI Vector Search in workflows-demos repository GitHub.

Big data

Questa sezione descrive i prodotti per big data integrati da Bigtable con.

Apache Beam

Apache Beam è un modello unificato per la definizione di dati paralleli in batch e flussi pipeline di elaborazione. La Connettore Bigtable Beam (BigtableIO) consente di eseguire operazioni in batch e in flussi su Bigtable in una pipeline.

Per un tutorial che mostra come utilizzare il connettore Bigtable Beam per eseguire il deployment di pipeline di dati a Dataflow, consulta Elaborare una Bigtable modifiche in tempo reale.

Apache Hadoop

Apache Hadoop è un framework che consente l'elaborazione distribuita di set di dati di grandi dimensioni in cluster di computer. Puoi utilizzare la modalità Dataproc per creare un cluster Hadoop, quindi eseguire Job MapReduce che leggono e scrivono in Bigtable.

Per un esempio di job MapReduce Hadoop che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Raccoglitore dati StreamSet

Il raccoglitore dati di StreamSets è un'applicazione di flussi di dati che puoi per configurare la scrittura di dati in Bigtable. StreamSets fornisce una libreria Bigtable nel suo repository GitHub all'indirizzo streamsets/datacollector.

Database a grafo

Questa sezione descrive i database di grafo con cui Bigtable si integra.

HGraphDB

HGraphDB è un livello client per l'utilizzo di Apache HBase o Bigtable come database di grafici. Implementa le interfacce Apache TinkerPop 3.

Per ulteriori informazioni sull'esecuzione di HGraphDB con il supporto di Bigtable, consulta la documentazione di HGraphDB.

JanusGraph

JanusGraph è un database a grafo scalabile. È ottimizzato per per archiviare ed eseguire query su grafici contenenti centinaia di miliardi di vertici con i bordi.

Per saperne di più sull'esecuzione di JanusGraph con Bigtable di assistenza, consulta la sezione Esecuzione di JanusGraph con Bigtable o JanusGraph documentazione.

Gestione dell'infrastruttura

Questa sezione descrive gli strumenti di gestione dell'infrastruttura Con l'integrazione di Bigtable.

Pivotal Cloud Foundry

Pivotal Cloud Foundry è una piattaforma per lo sviluppo e il deployment di applicazioni che offre la possibilità di associare un'applicazione a Bigtable.

Terraform

Terraform è uno strumento open source che codifica le API in file di configurazione dichiarativi. Questi file possono essere condivisi tra i membri del team, trattati come il codice, i contenuti modificati, riveduti e sottoposti al controllo delle versioni.

Per saperne di più sull'utilizzo di Bigtable con Terraform, consulta istanza Bigtable e Tabella Bigtable nella documentazione di Terraform.

Database di serie temporali e monitoraggio

Questa sezione descrive i database di serie temporali e gli strumenti di monitoraggio che Con l'integrazione di Bigtable.

Eroico

Heroic è un sistema di monitoraggio e un database di serie temporali. Heroic può utilizzare Bigtable per archiviare i suoi dati.

Per maggiori informazioni su Heroic, consulta il repository GitHub spotify/heroic, nonché la documentazione per la configurazione Bigtable e configurazione metriche.

OpenTSDB

OpenTSDB è un database di serie temporali che può utilizzare Bigtable per l'archiviazione. La documentazione di OpenTSDB fornisce informazioni per aiutarti a iniziare.