Utilizzare il modello di modifiche in tempo reale di Bigtable a BigQuery
In questa guida rapida imparerai a configurare una tabella Bigtable con un flusso di modifiche abilitato, eseguire una pipeline di modifiche in tempo reale, apportare modifiche alla tabella e vedere le modifiche trasmesse in tempo reale.
Prima di iniziare
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API Dataflow, Cloud Bigtable API, Cloud Bigtable Admin API, and BigQuery.
-
Nella console Google Cloud, attiva Cloud Shell.
Crea un set di dati BigQuery
Utilizza la console Google Cloud per creare un set di dati in cui sono archiviati i dati.
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, fai clic sul nome del tuo progetto.
Espandi l'opzione
Azioni e fai clic su Crea set di dati.Nella pagina Crea set di dati, segui questi passaggi:
- In ID set di dati, inserisci
bigtable_bigquery_quickstart
. - Lascia invariate le restanti impostazioni predefinite e fai clic su Crea set di dati.
- In ID set di dati, inserisci
Crea una tabella con un flusso di modifiche abilitato
Nella console Google Cloud, vai alla pagina Istanze Bigtable.
Fai clic sull'ID dell'istanza che stai utilizzando per questa guida rapida.
Se non hai un'istanza disponibile, crea un'istanza con le configurazioni predefinite in una regione vicino a te.
Nel riquadro di navigazione a sinistra, fai clic su Tabelle.
Fai clic su Crea una tabella.
Assegna alla tabella il nome
bigquery-changestream-quickstart
.Aggiungi una famiglia di colonne denominata
cf
.Seleziona Attiva modifiche in tempo reale.
Fai clic su Crea.
Nella pagina Tabelle di Bigtable, individua la tabella
bigquery-changestream-quickstart
.Nella colonna Change stream, fai clic su Connect (Connetti).
Nella finestra di dialogo, seleziona BigQuery.
Fai clic su Crea job Dataflow.
Inserisci i valori parametro negli appositi campi. Non è necessario fornire parametri facoltativi.
- Imposta l'ID profilo dell'applicazione Bigtable su
default
. - Imposta il set di dati BigQuery su
bigtable_bigquery_quickstart
.
- Imposta l'ID profilo dell'applicazione Bigtable su
Fai clic su Esegui job.
Prima di procedere, attendi che lo stato del job sia In fase di avvio o In esecuzione. Una volta che il job viene messo in coda, sono necessari circa 5 minuti.
Tieni il job aperto in una scheda, in modo da poterlo arrestare durante la pulizia delle risorse.
Scrivi alcuni dati in Bigtable
In Cloud Shell, scrivi alcune righe in Bigtable in modo che il log delle modifiche possa scrivere alcuni dati in BigQuery. Se scrivi i dati dopo la creazione del job, le modifiche verranno visualizzate. Non è necessario attendere che lo stato del job diventi
running
.cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user123 cf:col1=abc cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user546 cf:col1=def cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user789 cf:col1=ghi
Sostituisci quanto segue:
- PROJECT_ID: l'ID del progetto che stai utilizzando
- BIGTABLE_INSTANCE_ID: l'ID dell'istanza che contiene la tabella
bigquery-changestream-quickstart
Visualizza i log delle modifiche in BigQuery
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e il set di dati
bigtable_bigquery_quickstart
.Fai clic sulla tabella
bigquery-changestream-quickstart_changelog
.Per visualizzare il log delle modifiche, fai clic su Anteprima.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
Disabilita il flusso di modifiche nella tabella:
gcloud bigtable instances tables update bigquery-changestream-quickstart \ --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Elimina la tabella
bigquery-changestream-quickstart
:cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstart
Arresta la pipeline di modifiche in tempo reale:
Nella console Google Cloud, vai alla pagina Job di Dataflow.
Seleziona il job di flussi di dati dall'elenco dei job.
Nella barra di navigazione, fai clic su Interrompi.
Nella finestra di dialogo Arresta job, seleziona Annulla, quindi fai clic su Arresta job.
Elimina il set di dati BigQuery:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, trova il set di dati
bigtable_bigquery_quickstart
e fai clic su di esso.Fai clic su Elimina, digita
delete
e quindi fai clic su Elimina per confermare.
(Facoltativo) Elimina l'istanza se ne hai creata una nuova per questa guida rapida:
cbt deleteinstance BIGTABLE_INSTANCE_ID