Usa la plantilla de flujo de cambios de Bigtable a BigQuery
En esta guía de inicio rápido, aprenderás cómo configurar una tabla de Bigtable con un flujo de cambios habilitado, ejecutar una de flujos de cambios, realizar cambios en la tabla y, luego, ver los cambios transmitirse.
Antes de comenzar
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, Cloud Bigtable Admin API, and BigQuery APIs.
-
In the Google Cloud console, activate Cloud Shell.
Crea un conjunto de datos de BigQuery
Usa la consola de Google Cloud para crear un conjunto de datos que almacene los datos.
En la consola de Google Cloud, ve a la página de BigQuery.
En el panel Explorador, haz clic en el nombre de tu proyecto.
Expande la opción Acciones
y haz clic en Crear conjunto de datos.En la página Crear conjunto de datos, haz lo siguiente:
- En ID del conjunto de datos, ingresa
bigtable_bigquery_quickstart
. - Deja la configuración predeterminada restante como está y haz clic en Crear conjunto de datos.
- En ID del conjunto de datos, ingresa
Crea una tabla con una transmisión de cambios habilitada
En la consola de Google Cloud, ve a la página Instancias de Bigtable.
Haz clic en el ID de la instancia que usas para esta guía de inicio rápido.
Si no tienes una instancia disponible, crea una con la configuración parámetros de configuración de una región cercana a ti.
En el panel de navegación izquierdo, haz clic en Tablas.
Haz clic en Crea una tabla.
Asigna el nombre
bigquery-changestream-quickstart
a la tabla.Agrega una familia de columnas llamada
cf
.Selecciona Habilitar flujo de cambios.
Haz clic en Crear.
En la página Tablas de Bigtable, busca tu tabla.
bigquery-changestream-quickstart
En la columna Flujo de cambios, haz clic en Conectar.
En el cuadro de diálogo, selecciona BigQuery.
Haz clic en Crear trabajo de Dataflow.
En los campos de parámetros proporcionados, ingresa los valores de tus parámetros. No debes proporcionar cualquier parámetro opcional.
- Establece el ID de perfil de aplicación de Bigtable en
default
. - Establece el conjunto de datos de BigQuery en
bigtable_bigquery_quickstart
- Establece el ID de perfil de aplicación de Bigtable en
Haga clic en Ejecutar trabajo.
Espera hasta que el estado del trabajo sea Iniciando o En ejecución antes de continuar. Tarda alrededor de 5 minutos una vez que la tarea está en cola.
Mantén el trabajo abierto en una pestaña para que puedas detenerlo cuando realices la limpieza tus recursos.
Cómo escribir algunos datos en Bigtable
En Cloud Shell, escribe algunas filas en Bigtable para que las el registro de cambios puede escribir algunos datos en BigQuery. Siempre y cuando escribas los datos una vez creado el trabajo, aparecerán los cambios. No tienes que esperar a que el estado del trabajo sea
running
.cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user123 cf:col1=abc cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user546 cf:col1=def cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user789 cf:col1=ghi
Reemplaza lo siguiente:
- PROJECT_ID: Es el ID del proyecto que estás usando.
- BIGTABLE_INSTANCE_ID: Es el ID de la instancia que contiene la tabla
bigquery-changestream-quickstart
.
Consulta los registros de cambios en BigQuery
En la consola de Google Cloud, ve a la página de BigQuery.
En el panel Explorador, expande tu proyecto y el conjunto de datos
bigtable_bigquery_quickstart
.Haz clic en la tabla
bigquery-changestream-quickstart_changelog
.Para ver el registro de cambios, haz clic en Vista previa.
Limpia
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
Inhabilita el flujo de cambios en la tabla:
gcloud bigtable instances tables update bigquery-changestream-quickstart \ --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Borra la tabla
bigquery-changestream-quickstart
:cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstart
Detén la canalización del flujo de cambios:
En la consola de Google Cloud, ve a la página Trabajos de Dataflow.
Selecciona tu trabajo de transmisión en la lista de trabajos.
En la navegación, haz clic en Detener.
En el diálogo Detener trabajo, selecciona Cancelar y, luego, haz clic en Detener trabajo.
Borra el conjunto de datos de BigQuery:
En la consola de Google Cloud, ve a la página de BigQuery.
En el panel Explorador, busca el conjunto de datos
bigtable_bigquery_quickstart
y haz clic en él.Haz clic en Borrar, escribe
delete
y, luego, haz clic en Borrar para confirmar.
Borra la instancia si creaste una nueva para esta guía de inicio rápido (opcional):
cbt deleteinstance BIGTABLE_INSTANCE_ID