Integrazioni con Bigtable

Questa pagina descrive le integrazioni tra Bigtable e altri prodotti e i servizi di machine learning.

Servizi Google Cloud

Questa sezione descrive i servizi Google Cloud Con l'integrazione di Bigtable.

BigQuery

BigQuery è il servizio di Google data warehouse di analisi a basso costo. Puoi utilizzare BigQuery Bigtable per i seguenti scopi:

  • Puoi creare una tabella BigQuery esterna e utilizzarla per esegui una query sulla tabella Bigtable e unisci i dati ad altri e tabelle BigQuery. Per ulteriori informazioni, consulta la sezione Query Dati Bigtable.

  • Puoi esportare i tuoi dati BigQuery in un utilizzando l'ETL inversa (RETL) da BigQuery Bigtable. Per ulteriori informazioni, vedi Esportare i dati in Bigtable (anteprima).

Cloud Asset Inventory

Cloud Asset Inventory, che fornisce servizi di inventario basati su un database di serie temporali, supporta e restituisce i tipi di risorse Bigtable. Per un vedi Tipi di risorse supportate.

Data Catalog

Data Catalog è una funzionalità di Dataplex che Cataloga i metadati sulle risorse Bigtable. Le informazioni di Data Catalog sui tuoi dati possono facilitare analisi, riutilizzo dei dati, sviluppo di applicazioni e gestione dei dati. Per ulteriori informazioni informazioni, consulta Gestire gli asset di dati utilizzando Data Catalog.

Dataflow

Dataflow è un servizio cloud e un modello di programmazione per l'elaborazione dei big data. Dataflow supporta sia i flussi di dati sia i flussi di dati e l'elaborazione dei dati. Puoi utilizzare Dataflow per elaborare i dati archiviati in Bigtable o per archiviare l'output del tuo Dataflow una pipeline o un blocco note personalizzato. Puoi anche utilizzare i modelli Dataflow esportare e importare come Avro, Parquet o SequenceFiles.

Per iniziare, consulta la sezione Connettore Bigtable Beam.

Puoi anche utilizzare Bigtable come ricerca di coppie chiave-valore per arricchire i dati in una pipeline. Per una panoramica, consulta Arricchire i flussi di dati i tuoi dati. Per un tutorial, vedi Utilizzare Apache Beam e Bigtable per arricchire i tuoi dati.

Dataproc

Dataproc fornisce Apache Hadoop e i prodotti correlati come servizio gestito nel cloud. Con Dataproc, puoi eseguire Job Hadoop che leggono e scrivono su Bigtable.

Per un esempio di un job Hadoop MapReduce che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Vertex AI Vector Search è una tecnologia possono cercare tra miliardi di elementi semanticamente simili o semanticamente correlati. È utile per implementare motori per suggerimenti, chatbot e testo per la classificazione.

Puoi utilizzare Bigtable per archiviare gli incorporamenti vettoriali, esportarli un indice di Vector Search ed eseguire una query sull'indice per trovare elementi simili. Per un tutorial che illustra un flusso di lavoro di esempio, vedi Bigtable per Esportazione di Vertex AI Vector Search in workflows-demos repository GitHub.

Big data

Questa sezione descrive i prodotti per big data integrati da Bigtable con.

Apache Beam

Apache Beam è un modello unificato per la definizione di dati paralleli in batch e flussi pipeline di elaborazione. La Connettore Bigtable Beam (BigtableIO) consente di eseguire operazioni in batch e in flussi su Bigtable in una pipeline.

Per un tutorial che mostra come utilizzare il connettore Bigtable Beam per eseguire il deployment di pipeline di dati a Dataflow, consulta Elaborare una Bigtable modifiche in tempo reale.

Apache Hadoop

Apache Hadoop è un framework che consente l'elaborazione distribuita di set di dati di grandi dimensioni in cluster di computer. Puoi utilizzare Dataproc per creare un cluster Hadoop, quindi eseguire Job MapReduce che leggono e scrivono in Bigtable.

Per un esempio di un job Hadoop MapReduce che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Raccoglitore dati StreamSet

Il raccoglitore dati di StreamSets è un'applicazione di flussi di dati che puoi per configurare la scrittura di dati in Bigtable. StreamSets fornisce una libreria Bigtable nel suo repository GitHub all'indirizzo streamsets/datacollector.

Database a grafo

Questa sezione descrive i database di grafici integrati da Bigtable con.

HGraphDB

HGraphDB è un livello client per l'utilizzo di Apache HBase o Bigtable come database di grafici. Implementa il protocollo Apache TinkerPop. 3 interfacce.

Per ulteriori informazioni sull'esecuzione di HGraphDB con il supporto Bigtable, consulta la documentazione di HGraphDB.

JanusGraph

JanusGraph è un database di grafici scalabile. È ottimizzato per per archiviare ed eseguire query su grafici contenenti centinaia di miliardi di vertici i bordi.

Per saperne di più sull'esecuzione di JanusGraph con Bigtable di assistenza, consulta la sezione Esecuzione di JanusGraph con Bigtable o JanusGraph documentazione.

Gestione dell'infrastruttura

Questa sezione descrive gli strumenti di gestione dell'infrastruttura Con l'integrazione di Bigtable.

Pivotal Cloud Foundry

Pivotal Cloud Foundry è una piattaforma per lo sviluppo e il deployment di applicazioni che offre la possibilità di associare un'applicazione a Bigtable.

Terraform

Terraform è uno strumento open source che codifica le API in di configurazione dei deployment. Questi file possono essere condivisi tra i membri del team, trattati come il codice, i contenuti modificati, riveduti e sottoposti al controllo delle versioni.

Per saperne di più sull'utilizzo di Bigtable con Terraform, consulta istanza Bigtable e Tabella Bigtable nel documentazione di Terraform.

Database di serie temporali e monitoraggio

Questa sezione descrive i database di serie temporali e gli strumenti di monitoraggio che Con l'integrazione di Bigtable.

Eroica

Heroic è un sistema di monitoraggio e un database di serie temporali. Heroic può usare Bigtable per archiviare i dati.

Per maggiori informazioni su Heroic, consulta il repository GitHub spotify/heroic, nonché la documentazione per la configurazione Bigtable e configurazione metriche.

OpenTSDB

OpenTSDB è un database di serie temporali che può utilizzare Bigtable per l'archiviazione. La documentazione di OpenTSDB fornisce informazioni per aiutarti a iniziare.