Crea una tabla con cambios habilitados para el flujo y captura los cambios
Aprende a configurar una tabla de Cloud Bigtable con una transmisión de cambios habilitada, ejecutar una canalización de flujo de cambios, realizar cambios en tu tabla y, luego, ver los cambios transmitidos.
Antes de comenzar
-
En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.
-
Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.
-
Habilita las API de Dataflow and Cloud Bigtable.
-
En la consola de Google Cloud, activa Cloud Shell.
Cree una tabla con un flujo de cambios habilitado
En la consola de Google Cloud, ve a la página Instancias de Bigtable.
Haz clic en el ID de la instancia que usas para esta guía de inicio rápido.
Si no tienes una instancia disponible, crea una con la configuración predeterminada en una región cercana.
En el panel de navegación izquierdo, haz clic en Tablas.
Haz clic en Crea una tabla.
Asigna el nombre
change-streams-quickstart
a la tabla.Agrega una familia de columnas llamada
cf
.Selecciona Habilitar el flujo de cambios.
Haz clic en Crear.
Inicializa una canalización de datos para capturar el flujo de cambios
En Cloud Shell, ejecute los siguientes comandos para descargar y ejecutar el código.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
Reemplaza lo siguiente:
- PROJECT_ID: Es el ID del proyecto que usas.
- BIGTABLE_INSTANCE_ID: El ID de la instancia que contiene la tabla nueva
- BIGTABLE_REGION: Es la región en la que se encuentra la instancia de Bigtable, como
us-east5
.
En la consola de Google Cloud, ve a la página Dataflow.
Haz clic en el trabajo con un nombre que comience con changestreamquickstart.
En la parte inferior de la pantalla, haga clic en Mostrar para abrir el panel de registros.
Haga clic en Registros de trabajador para supervisar el resultado del flujo de cambios.
En Cloud Shell, escriba algunos datos en Bigtable para ver el proceso de transmisión de cambios.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
En la consola de Google Cloud, asegúrate de que la Gravedad esté configurada como mínimo
Info
.Los registros de salida del registro de trabajadores contienen lo siguiente:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
Limpia
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que se usaron en esta página.
Inhabilitar el flujo de cambios en la tabla
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Borra la tabla
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
Detén la canalización del flujo de cambios:
En la consola de Google Cloud, ve a la página Trabajos de Dataflow.
Selecciona tu trabajo de transmisión en la lista de trabajos.
En la navegación, haz clic en Detener.
En el diálogo Detener trabajo, cancele la canalización y, luego, haga clic en Detener trabajo.
Opcional: Borra la instancia si creaste una nueva para esta guía de inicio rápido:
cbt deleteinstance BIGTABLE_INSTANCE_ID