Crea una tabella abilitata per i flussi di modifiche e acquisisci le modifiche
Scopri come configurare una tabella Bigtable con un flusso di modifiche abilitato, eseguire una pipeline di flusso di modifiche, apportare modifiche alla tabella e visualizzare le modifiche in streaming.
Prima di iniziare
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, and Cloud Bigtable Admin API APIs.
-
In the Google Cloud console, activate Cloud Shell.
Crea una tabella con un flusso di modifiche abilitato
Nella console Google Cloud, vai alla pagina Istanze di Bigtable.
Fai clic sull'ID dell'istanza che utilizzi per questa guida rapida.
Se non hai un'istanza disponibile, creala con le configurazioni predefinite in una regione vicino a te.
Nel riquadro di navigazione a sinistra, fai clic su Tables (Tabelle).
Fai clic su Crea una tabella.
Assegna un nome alla tabella
change-streams-quickstart
.Aggiungi una famiglia di colonne denominata
cf
.Seleziona Attiva flusso di modifiche.
Fai clic su Crea.
Inizializza una pipeline di dati per acquisire il flusso di variazioni
In Cloud Shell, esegui i seguenti comandi per scaricare il codice ed eseguirlo.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
Sostituisci quanto segue:
- PROJECT_ID: l'ID del progetto in uso
- BIGTABLE_INSTANCE_ID: l'ID dell'istanza che deve contenere la nuova tabella
- BIGTABLE_REGION: la regione in cui si trova l'istanza Bigtable, ad esempio
us-east5
Nella console Google Cloud, vai alla pagina Dataflow.
Fai clic sul job il cui nome inizia con changestreamquickstart.
Nella parte inferiore dello schermo, fai clic su Mostra per aprire il riquadro dei log.
Fai clic su Log del worker per monitorare l'output dello stream di modifiche.
In Cloud Shell, scrivi alcuni dati in Bigtable per visualizzare il processo dello stream delle modifiche.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
Nella console Google Cloud, assicurati che Serietà sia impostata su almeno
Info
.I log di output del log del worker contengono quanto segue:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
Disattiva il flusso di modifiche nella tabella
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Elimina la tabella
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
Interrompi la pipeline del flusso di modifiche:
Nella console Google Cloud, vai alla pagina Job di Dataflow.
Seleziona il tuo job di streaming dall'elenco dei job.
Nella barra di navigazione, fai clic su Interrompi.
Nella finestra di dialogo Arresta job, annulla la pipeline e fai clic su Arresta job.
(Facoltativo) Elimina l'istanza se ne hai creata una nuova per questa guida rapida:
cbt deleteinstance BIGTABLE_INSTANCE_ID