Crea una tabella abilitata per il flusso di modifiche e acquisisci le modifiche
Scopri come configurare una tabella Cloud Bigtable con un flusso di modifiche abilitato, eseguire una pipeline di flusso di modifiche, apportare modifiche alla tabella e quindi visualizzare le modifiche in streaming.
Prima di iniziare
-
Nella console di Google Cloud Console, nella pagina del selettore dei progetti, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API Dataflow and Cloud Bigtable.
-
In Google Cloud Console, attiva Cloud Shell.
Crea una tabella con un flusso di modifiche abilitato
Nella console Google Cloud, vai alla pagina Istanze Bigtable.
Fai clic sull'ID dell'istanza che stai utilizzando per questa guida rapida.
Se non hai un'istanza disponibile, creane una con le configurazioni predefinite in una regione vicino a te.
Nel riquadro di navigazione a sinistra, fai clic su Tabelle.
Fai clic su Crea una tabella.
Assegna alla tabella il nome
change-streams-quickstart
.Aggiungi una famiglia di colonne denominata
cf
.Seleziona Attiva flusso di modifiche.
Fai clic su Crea.
Inizializza una pipeline di dati per acquisire il flusso di modifiche
In Cloud Shell, esegui questi comandi per scaricare il codice ed eseguirlo.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
Sostituisci quanto segue:
- PROJECT_ID: l'ID del progetto che stai utilizzando
- BIGTABLE_INSTANCE_ID: l'ID dell'istanza che contiene la nuova tabella
- BIGTABLE_REGION: la regione in cui si trova la tua istanza Bigtable, ad esempio
us-east5
Nella console Google Cloud, vai alla pagina Dataflow.
Fai clic sul job con un nome che inizia con changestreamquickstart.
Nella parte inferiore dello schermo, fai clic su Mostra per aprire il riquadro dei log.
Fai clic su Log worker per monitorare l'output del flusso di modifiche.
In Cloud Shell, scrivi alcuni dati in Bigtable per vedere il processo di flusso di modifiche.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
Nella console Google Cloud, assicurati che l'opzione Gravità sia impostata su almeno
Info
.I log di output del log del worker contengono quanto segue:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:
Disabilita il flusso di modifiche nella tabella
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Elimina la tabella
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
Arresta la pipeline di modifica del flusso:
Nella console Google Cloud, vai alla pagina Job di Dataflow.
Seleziona il job di streaming dall'elenco dei job.
Nella navigazione, fai clic su Interrompi.
Nella finestra di dialogo Arresta job, annulla la pipeline e fai clic su Arresta job.
(Facoltativo) Elimina l'istanza se ne hai creata una nuova per questa guida rapida:
cbt deleteinstance BIGTABLE_INSTANCE_ID