Prepara datos con Gemini
En este documento, se describe cómo generar y administrar sugerencias de código SQL para tus preparaciones de datos en BigQuery.
Para obtener más información, consulta Introducción a la preparación de datos de BigQuery.
Antes de comenzar
Abre el editor de preparación de datos en BigQuery
Para abrir el editor de preparación de datos en BigQuery, crea una preparación de datos nueva, una a partir de una tabla existente o abre una preparación de datos existente. Para obtener más información sobre lo que sucede cuando creas una preparación de datos, consulta Puntos de entrada de la preparación de datos.
En la página BigQuery Studio, puedes ir al editor de preparación de datos de las siguientes maneras:
Crear nuevo
Para crear una nueva preparación de datos en BigQuery, sigue estos pasos:
- En la consola de Google Cloud, ve a la página de BigQuery Studio.
Ir a BigQuery - Ve a la lista Crear y haz clic en Preparación de datos. El editor de preparación de datos se muestra en una nueva pestaña de preparación de datos sin título.
- En la barra de búsqueda del editor, ingresa el nombre de la tabla o las palabras clave y
selecciona una tabla. Se abrirá el editor de preparación de datos de la tabla, que mostrará una vista previa de tus datos en la pestaña Datos y un conjunto inicial de sugerencias de preparación de datos de Gemini.
Aparecerá un recurso de Preparación de datos en el panel Explorador, en el que podrás acceder a esta preparación en el futuro. - Opcional: Para simplificar la vista, activa el modo de pantalla completa haciendo clic en pantalla completa Pantalla completa.
Crear nuevo desde la tabla
Para crear una nueva preparación de datos a partir de una tabla existente, sigue estos pasos:
- En la consola de Google Cloud, ve a la página de BigQuery Studio.
Ir a BigQuery - En el panel Explorador, mantén el puntero sobre una tabla.
- Haz clic en more_vert
Menú > Consulta en > Preparación de datos. Se abre el editor de preparación de datos de la tabla, que muestra una vista previa de tus datos en la pestaña Datos y un conjunto inicial de sugerencias de preparación de datos de Gemini.
Aparecerá un recurso de Preparación de datos en el panel Explorador, en el que podrás acceder a esta preparación en el futuro. - Opcional: Para simplificar la vista, activa el modo de pantalla completa haciendo clic en pantalla completa Pantalla completa.
Abrir existente
Para abrir el editor de una preparación de datos existente, sigue estos pasos:
- En la consola de Google Cloud, ve a la página de BigQuery Studio.
Ir a BigQuery - En el panel Explorador, haz clic en el nombre de tu proyecto y en Preparación de datos.
- Selecciona la preparación de datos existente. Se muestra la vista de gráfico de la canalización de preparación de datos.
- Selecciona uno de los nodos del gráfico. Se abrirá el editor de preparación de datos de la tabla, que mostrará una vista previa de tus datos en la pestaña Datos y un conjunto inicial de sugerencias de preparación de datos de Gemini.
- Opcional: Para simplificar la vista, activa el modo de pantalla completa haciendo clic en pantalla completa Pantalla completa.
Crea pasos de preparación de datos
Los datos se preparan en pasos. Puedes obtener una vista previa de los pasos sugeridos por Gemini o aplicarlos. También puedes ajustar las sugerencias o aplicar tus propios pasos. Para obtener más información sobre los pasos de preparación de datos compatibles, consulta Pasos compatibles.
Consulta, edita y aplica las sugerencias de Gemini
Cuando abres el editor de preparación de datos de tu tabla en los pasos anteriores, Gemini inspecciona los datos y el esquema de la tabla que cargaste y genera sugerencias.
Cuando veas los datos en la vista de datos, haz clic en el nombre de una columna o en una celda en particular. Gemini genera sugerencias de filtros y transformaciones específicas para esa columna o celda.
Aplicar una sugerencia de Gemini como paso de preparación de datos:
- En la vista de datos, ve a la lista Pasos y revisa las sugerencias.
- Opcional: Para obtener una vista previa del resultado de la tarjeta de sugerencia, haz clic en Vista previa.
Opcional: Para modificar la tarjeta de sugerencias con lenguaje natural, haz clic en Editar.
Para obtener más información sobre cómo modificar las sugerencias, consulta Cómo mejorar las sugerencias con un ejemplo y Cómo agregar pasos con lenguaje natural o expresiones SQL.
Haz clic en Aplicar.
Cómo navegar por la lista de pasos
Puedes realizar las siguientes acciones en la vista de datos cuando haces clic en Pasos aplicados y examinas la lista de pasos:
- Para editar o quitar un paso de la lista, haz clic en more_vert Menú y realiza el cambio.
- Selecciona cualquier paso de la lista para ver la muestra de datos y el esquema a partir de este paso en particular.
- Selecciona un paso de la lista para insertar pasos nuevos después de él.
Mejora las sugerencias con un ejemplo
Para ajustar las sugerencias de Gemini, muéstrale un ejemplo de cómo deberían verse los datos en la celda:
En la vista de datos, edita los valores de una a tres celdas para demostrar cómo deberían verse los valores de esa columna. Por ejemplo, ingresa una fecha de la forma en que deseas dar formato a todas las fechas. Gemini genera sugerencias nuevas según tus cambios.
Para modificar una tarjeta de sugerencias, haz clic en Editar.
Haz clic en Aplicar.
Agrega pasos con lenguaje natural o expresiones SQL
Si ninguna de las sugerencias satisface tus necesidades, agrega la tuya propia. Para ello, haz clic en Agregar paso, selecciona un tipo de paso y, luego, ingresa una instrucción en lenguaje natural que describa tu intención.
Agrega una transformación
- En la vista de datos, haz clic en Agregar paso y elige la opción Transformación.
- En el campo Descripción, ingresa una instrucción, como
Convert the state column to a uppercase
. Haz clic en Enviar Enviar.
Gemini genera una expresión SQL y una descripción nueva según tu instrucción.
En la lista Columna de destino, selecciona o ingresa un nombre de columna.
Opcional: Para actualizar la expresión de SQL, revisa la instrucción y haz clic en enviar Enviar o ingresa manualmente una expresión de SQL.
Opcional: Haz clic en Vista previa y revisa el paso.
Haz clic en Aplicar.
Filtra filas
Para agregar un filtro que quite filas, sigue estos pasos:
- En la vista de datos, haz clic en Agregar paso > Filtrar.
- En el campo Descripción, ingresa una instrucción, como
Column ID should not be NULL
. - Haz clic en Generar. Gemini genera una expresión SQL y una descripción nueva según tu instrucción.
- Opcional: Para actualizar la expresión SQL, revisa la instrucción y haz clic en enviar Enviar o ingresa una expresión SQL de forma manual.
- Opcional: Haz clic en Vista previa y revisa el paso.
- Haz clic en Aplicar.
Formato de la expresión de filtro
Las expresiones SQL para los filtros retienen las filas que coinciden con la condición especificada. Esto equivale a una sentencia SELECT … WHERE SQL_EXPRESSION
.
Por ejemplo, para retener los registros en los que la columna year
es mayor o igual que 2000
, la condición es year >= 2000
.
Las expresiones deben seguir la sintaxis de SQL de BigQuery para la
cláusula WHERE
.
Configura la tabla de errores y agrega una regla de validación
Puedes agregar un filtro que cree una regla de validación, que envíe errores a una tabla de errores o que haga que falle la ejecución de la preparación de datos.
Configura la tabla de errores
Para configurar tu tabla de errores, sigue estos pasos:
- En la vista de datos, ve a la barra de herramientas y haz clic en Más > Tabla de errores.
- Haz clic en Habilitar tabla de errores.
- Define la ubicación de la tabla.
- Opcional: Define una duración máxima para mantener los errores.
- Haz clic en Guardar.
Agrega una regla de validación
Para agregar una regla de validación, sigue estos pasos:
- En la vista de datos, haz clic en Agregar paso > Filtrar.
- Ingresa una descripción para el paso.
- Ingresa una expresión SQL, en forma de una cláusula
WHERE
. - Opcional: Si deseas que la expresión SQL actúe como una regla de validación, selecciona la casilla de verificación Las filas de validación con errores se envían a la tabla de errores. También puedes cambiar un filtro por una validación en la barra de herramientas de preparación de datos. Para ello, haz clic en Más > Tabla de errores.
- Opcional: Haz clic en Vista previa y revisa el paso.
- Haz clic en Aplicar.
Borra una columna
Para borrar una columna de una preparación de datos, sigue estos pasos:
- En la vista de esquema, haz clic en more_vert Menú junto a la columna que quieres borrar.
- Haz clic en Borrar. Se agrega un nuevo paso aplicado para la columna borrada.
Cómo agregar una operación de unión
Para agregar un paso de operación de unión entre dos fuentes en la preparación de datos, sigue estos pasos:
- En la vista de datos de un nodo en la preparación de datos, ve a la lista Pasos y haz clic en Agregar paso > Unión.
- En el cuadro de diálogo Configurar unión, selecciona la otra tabla involucrada en la operación de unión (denominada lado derecho de la unión).
- Opcional: Selecciona las claves de unión para cada tabla. Las claves de unión deben tener el mismo tipo de datos.
- Opcional: Selecciona el tipo de operación de combinación que deseas realizar, como Inner join.
Opcional: Para preparar la tabla del lado derecho antes de especificar una clave de unión, por ejemplo, cuando los tipos de datos de las dos columnas de la unión difieren, sigue estos pasos:
- Guardar una unión sin seleccionar una clave de unión
- Ve a la vista de gráfico y selecciona la tabla de origen del lado derecho.
- Prepara la tabla del lado derecho, como transformar el tipo de datos de una columna.
- Para editar la unión que guardaste en el paso anterior, establece una clave.
Haz clic en Crear.
Se conservan todas las filas de la tabla, incluso si no hay un valor correspondiente en una de las tablas.
Después de guardar el paso, la tabla de origen que seleccionaste (el lado derecho de la combinación) y la operación de combinación se reflejan en la lista de pasos aplicados y en los nodos de la vista de gráfico de tu preparación de datos.
Cómo agregar o cambiar una tabla de destino
Para agregar o cambiar una tabla de destino para el resultado de la preparación de datos, sigue estos pasos:
- En la vista de datos, haz clic en Agregar > Destino.
- Selecciona el proyecto en el que se almacena la tabla de destino.
- Selecciona uno de los conjuntos de datos o carga uno nuevo.
- Ingresa una tabla de destino. Si la tabla no existe, la preparación de datos creará una tabla nueva en la primera ejecución. Para obtener más información, consulta Modo de escritura.
- Selecciona tu conjunto de datos como el conjunto de datos de destino.
- Haz clic en Guardar.
Ejecuta la preparación de datos
Después de agregar los pasos de preparación de datos, configurar el destino y corregir los errores de validación, puedes realizar ejecuciones de prueba en una muestra de los datos o implementar los pasos y programar ejecuciones de preparación de datos. Para obtener más información, consulta Programa la preparación de datos.
Actualiza los ejemplos de preparación de datos
Los datos de la muestra no se actualizan automáticamente. Si los datos de las tablas de origen para la preparación de datos cambiaron, pero los cambios no se reflejan en la muestra de datos de la preparación, haz clic en Más > Actualizar muestra.
¿Qué sigue?
- Obtén información para programar la preparación de datos.
- Obtén información para administrar la preparación de datos.
- Obtén más información sobre las cuotas y los límites de Gemini en BigQuery.
- Revisa los precios de Gemini en BigQuery.