Crea una tabella abilitata per i flussi di modifiche e acquisisci le modifiche
Scopri come configurare una tabella Bigtable con un flusso di modifiche abilitato, eseguire una pipeline di modifiche in tempo reale, apportare modifiche alla tabella e vedere le modifiche trasmesse in streaming.
Prima di iniziare
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, and Cloud Bigtable Admin API APIs.
-
In the Google Cloud console, activate Cloud Shell.
Crea una tabella con un flusso di modifiche abilitato
Nella console Google Cloud, vai alla pagina Istanze di Bigtable.
Fai clic sull'ID dell'istanza che stai utilizzando per questa guida rapida.
Se non hai un'istanza disponibile, creala con le configurazioni predefinite in una regione vicino a te.
Nel riquadro di navigazione a sinistra, fai clic su Tables (Tabelle).
Fai clic su Crea una tabella.
Assegna alla tabella il nome
change-streams-quickstart
.Aggiungi una famiglia di colonne denominata
cf
.Seleziona Attiva flusso di modifiche.
Fai clic su Crea.
Inizializza una pipeline di dati per acquisire il flusso di modifiche
In Cloud Shell, esegui i seguenti comandi per scaricare ed eseguire il codice.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
Sostituisci quanto segue:
- PROJECT_ID: l'ID del progetto che stai utilizzando
- BIGTABLE_INSTANCE_ID: l'ID dell'istanza che dovrà contenere la nuova tabella
- BIGTABLE_REGION: la regione in cui si trova l'istanza Bigtable, ad esempio
us-east5
Nella console Google Cloud, vai alla pagina Dataflow.
Fai clic sul job con un nome che inizia con changestreamquickstart.
Nella parte inferiore dello schermo, fai clic su Mostra per aprire il riquadro dei log.
Fai clic su Log dei worker per monitorare l'output del flusso di modifiche.
In Cloud Shell, scrivi alcuni dati in Bigtable per visualizzare il processo di modifiche in tempo reale.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
Nella console Google Cloud, assicurati che Serietà sia impostata su almeno
Info
.I log di output del log del worker contengono quanto segue:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
Disabilita le modifiche in tempo reale nella tabella
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Elimina la tabella
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
Interrompi la pipeline del flusso di modifiche:
Nella console Google Cloud, vai alla pagina Job di Dataflow.
Seleziona il tuo job di streaming dall'elenco dei job.
Nella barra di navigazione, fai clic su Interrompi.
Nella finestra di dialogo Arresta job, annulla la pipeline e fai clic su Arresta job.
(Facoltativo) Elimina l'istanza se ne hai creata una nuova per questa guida rapida:
cbt deleteinstance BIGTABLE_INSTANCE_ID