Realiza análisis con el lienzo de datos de BigQuery

El lienzo de datos de BigQuery Studio, que es una función de Gemini en BigQuery, te permite encontrar, transformar, consultar y visualizar datos con instrucciones de lenguaje natural y una interfaz gráfica para flujos de trabajo de análisis.

Para los flujos de trabajo de análisis, el lienzo de datos de BigQuery usa un grafo acíclico dirigido (DAG), que proporciona una vista gráfica de tu flujo de trabajo. En el lienzo de datos de BigQuery, puedes iterar en los resultados de las consultas y trabajar con varias ramas de consulta en un solo lugar.

El lienzo de datos de BigQuery está diseñado para acelerar las tareas de análisis y ayudar a los profesionales de datos, como analistas, ingenieros de datos y otros, con su recorrido de datos a estadísticas. No requiere que tengas conocimientos técnicos sobre herramientas específicas, solo familiaridad básica con la lectura y escritura de SQL. El lienzo de datos de BigQuery funciona con los metadatos de Dataplex para identificar las tablas adecuadas según el lenguaje natural.

El lienzo de datos de BigQuery no está diseñado para que los usuarios empresariales lo usen directamente.

El lienzo de datos de BigQuery usa Gemini en BigQuery para encontrar tus datos, crear SQL, generar gráficos y crear resúmenes de datos.

Descubre cómo y cuándo Gemini para Google Cloud usa tus datos.

Funciones

El lienzo de datos de BigQuery te permite hacer lo siguiente:

  • Usa consultas en lenguaje natural o la sintaxis de búsqueda de palabras clave con metadatos de Dataplex para encontrar recursos, como tablas, vistas o vistas materializadas.

  • Usa lenguaje natural para consultas básicas en SQL, como las siguientes:

    • Consultas que contienen cláusulas FROM, funciones matemáticas, arrays y structs
    • Operaciones JOIN para dos tablas
  • Visualiza los datos con los siguientes tipos de gráficos:

    • Gráfico de barras
    • Mapa de calor
    • Gráfico de líneas
    • Gráfico circular
    • Diagrama de dispersión
  • Crea visualizaciones personalizadas con lenguaje natural para describir lo que deseas.

  • Automatiza las estadísticas de datos.

Limitaciones

  • Es posible que los comandos de lenguaje natural no funcionen bien con lo siguiente:

    • BigQuery ML
    • Apache Spark
    • Tablas de objetos
    • BigLake
    • INFORMATION_SCHEMA vistas
    • JSON
    • Campos anidados y repetidos
    • Funciones y tipos de datos complejos, como DATETIME y TIMEZONE
  • Las visualizaciones de datos no funcionan con los gráficos de mapas geográficos.

Sugiere prácticas recomendadas

Con las técnicas de instrucción adecuadas, puedes generar consultas en SQL complejas. Las siguientes sugerencias ayudan al lienzo de datos de BigQuery a definir mejor tus instrucciones en lenguaje natural para aumentar la exactitud de tus consultas:

  • Escribe con claridad. Expresa tu solicitud de forma clara y evita ser vago.

  • Haz preguntas directas. Para obtener la respuesta más precisa, haz una pregunta a la vez y mantén tus instrucciones concisas. Si es necesario, separa las instrucciones en diferentes nodos en el lienzo de datos de BigQuery.

  • Proporciona instrucciones enfocadas y explícitas. Destaca los términos clave en tus instrucciones.

  • Especifica el orden de las operaciones. Proporciona instrucciones de forma clara y ordenada. Divide las tareas en pasos pequeños y enfocados.

  • Define mejor e itera. Prueba diferentes frases y enfoques para ver cuál genera los mejores resultados.

Para obtener más información, consulta Sugiere prácticas recomendadas para el lienzo de datos de BigQuery.

Antes de comenzar

  1. Asegúrate de que Gemini en BigQuery esté habilitado para tu proyecto de Google Cloud. Por lo general, un administrador realiza este paso.
  2. Asegúrate de tener los permisos de Identity and Access Management (IAM) necesarios para usar el lienzo de datos de BigQuery.

Roles obligatorios

Para obtener los permisos que necesitas para usar el lienzo de datos de BigQuery, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Para obtener más información sobre los roles y permisos de IAM en BigQuery, consulta Introducción a IAM.

Usa el lienzo de datos de BigQuery

Puedes usar el lienzo de datos de BigQuery en la consola de Google Cloud, una consulta o una tabla.

  1. Ve a la página de BigQuery.

    Ir a BigQuery

  2. En el editor de consultas, junto a Consulta en SQL, haz clic en Crear y, luego, en Lienzo de datos.

    Ícono para crear lienzo de datos.

  3. En el campo de instrucción Lenguaje natural, ingresa una instrucción en lenguaje natural.

    Por ejemplo, si ingresas Find me tables related to trees, el lienzo de datos de BigQuery muestra una lista de tablas posibles, incluidos conjuntos de datos públicos, como bigquery-public-data.usfs_fia.plot_tree o bigquery-public-data.new_york_trees.tree_species.

  4. Selecciona una tabla.

    Se agrega un nodo de tabla para la tabla seleccionada al lienzo de datos de BigQuery. Para ver la información del esquema, los detalles de la tabla o obtener una vista previa de los datos, selecciona las distintas pestañas del nodo de la tabla.

Prueba flujos de trabajo de ejemplo

En esta sección, se muestran diferentes formas de usar el lienzo de datos de BigQuery en los flujos de trabajo de análisis.

Ejemplo de flujo de trabajo: Busca, consulta y visualiza datos

En este ejemplo, usarás instrucciones de lenguaje natural en el lienzo de datos de BigQuery para encontrar datos, generar una consulta y editarla. Luego, creas un gráfico.

Instrucción 1: Busca datos

  1. En la consola de Google Cloud, ve a la página de BigQuery.

    Ir a BigQuery

  2. En el editor de consultas, junto a Consulta en SQL, haz clic en Crear y, luego, en Lienzo de datos.

    Ícono para crear lienzo de datos.

  3. En el campo de instrucción Lenguaje natural, ingresa la siguiente instrucción en lenguaje natural:

    Chicago taxi trips
    

    El lienzo de datos de BigQuery genera una lista de tablas potenciales en función de los metadatos de Dataplex. Puedes seleccionar varias tablas.

  4. Selecciona la tabla bigquery-public-data.chicago_taxi_trips.taxi_trips y, luego, haz clic en Agregar al lienzo.

    Se agrega un nodo de la tabla para taxi_trips al lienzo de datos de BigQuery. Para ver la información del esquema, los detalles de la tabla o obtener una vista previa de los datos, selecciona las distintas pestañas del nodo de la tabla.

Instrucción 2: Genera una consulta en SQL en la tabla seleccionada

Para generar una consulta en SQL para la tabla bigquery-public-data.chicago_taxi_trips.taxi_trips, haz lo siguiente:

  1. En el lienzo de datos, haz clic en Consultar.

  2. En el campo de instrucción Lenguaje natural, ingresa lo siguiente:

    Get me the 100 longest trips
    

    El lienzo de datos de BigQuery genera una consulta en SQL similar a la que se muestra a continuación:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Instrucción 3: Edita la consulta

Para editar la consulta que generaste, puedes hacerlo de forma manual o cambiar la instrucción en lenguaje natural y volver a generar la consulta. En este ejemplo, usas una instrucción de lenguaje natural para editar la consulta y seleccionar solo los viajes en los que el cliente pagó con efectivo.

  1. En el campo de instrucción Lenguaje natural, ingresa lo siguiente:

    Get me the 100 longest trips where the payment type is cash
    

    El lienzo de datos de BigQuery genera una consulta en SQL similar a la que se muestra a continuación:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    En el ejemplo anterior, PROJECT_ID es el ID de tu proyecto de Google Cloud.

  2. Para ver los resultados de la consulta, haz clic en Ejecutar.

Crea un gráfico

  1. En el lienzo de datos, haz clic en Visualizar.
  2. Haz clic en Crear gráfico de barras.

    El lienzo de datos de BigQuery crea un gráfico de barras que muestra la mayor cantidad de millas de viaje por ID de viaje. Además de proporcionar un gráfico, el lienzo de datos de BigQuery resume algunos de los detalles clave de los datos que respaldan la visualización.

  3. Tener conocimiento sobre uno o más de los siguientes temas:

    • Para modificar el gráfico, haz clic en Editar y, luego, edítalo en el panel Editar visualización.
    • Para compartir el lienzo de datos, haz clic en Compartir y, luego, en Compartir vínculo para copiar el vínculo del lienzo de datos de BigQuery.
    • Para limpiar el lienzo de datos, selecciona Más acciones y, luego, Borrar lienzo. Este paso genera un lienzo en blanco.

Ejemplo de flujo de trabajo: Une tablas

En este ejemplo, usas instrucciones de lenguaje natural en el lienzo de datos de BigQuery para buscar datos y unir tablas. Luego, exportas una consulta como un notebook.

Instrucción 1: Busca datos

  1. En el campo de instrucción Lenguaje natural, ingresa la siguiente instrucción:

    Information about trees
    

    El lienzo de datos de BigQuery sugiere varias tablas que tienen información sobre árboles.

  2. Para este ejemplo, selecciona la tabla bigquery-public-data.new_york_trees.tree_census_1995 y, luego, haz clic en Agregar al lienzo.

    La tabla se mostrará en el lienzo.

Instrucción 2: Une las tablas en su dirección

  1. En el lienzo de datos, haz clic en Unir.

    El lienzo de datos de BigQuery sugiere tablas para unir.

  2. Para abrir un nuevo campo de instrucción de Lenguaje natural, haz clic en Buscar tablas.

  3. En el campo de instrucción Lenguaje natural, ingresa la siguiente instrucción:

    Information about trees
    
  4. Selecciona la tabla bigquery-public-data.new_york_trees.tree_census_2005 y haz clic en Agregar al lienzo.

    La tabla se mostrará en el lienzo.

  5. En el lienzo de datos, haz clic en Unir.

  6. En la sección En este lienzo, selecciona la casilla de verificación Celda de tabla y, luego, haz clic en Aceptar.

  7. En el campo de instrucción Lenguaje natural, ingresa la siguiente instrucción:

    Join on address
    

    El lienzo de datos de BigQuery propone la consulta en SQL para unir estas dos tablas en su dirección:

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Para ejecutar la consulta y ver los resultados, haz clic en Ejecutar.

Exporta una consulta como un notebook

El lienzo de datos de BigQuery te permite exportar tus consultas como un notebook.

  1. En el lienzo de datos, haz clic en Exportar como notebook.
  2. En el panel Guardar notebook, ingresa el nombre del notebook y la región en la que deseas guardarlo.
  3. Haz clic en Guardar. El notebook se creó correctamente.
  4. Opcional: Para ver el notebook creado, haz clic en Abrir.

Ejemplo de flujo de trabajo: Edita un gráfico con una instrucción

En este ejemplo, usas instrucciones de lenguaje natural en el lienzo de datos de BigQuery para encontrar, consultar y filtrar datos y, luego, editar los detalles de la visualización.

Instrucción 1: Busca datos

  1. Para encontrar datos sobre los nombres de EE.UU., ingresa el siguiente mensaje:

    Find data about USA names
    

    El lienzo de datos de BigQuery genera una lista de tablas.

  2. Para este ejemplo, selecciona la tabla bigquery-public-data.usa_names.usa_1910_current y, luego, haz clic en Agregar al lienzo.

Instrucción 2: Consulta los datos

  1. Para consultar los datos, en el lienzo de datos, haz clic en Consulta y, luego, ingresa el siguiente mensaje:

    Summarize this data
    

    El lienzo de datos de BigQuery genera una consulta similar a la que se muestra a continuación:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Haz clic en Ejecutar. Se muestran los resultados de la consulta.

Instrucción 3: Filtra los datos

  1. En el lienzo de datos, haz clic en Consultar estos resultados.
  2. Para filtrar los datos, en el campo de instrucción SQL, ingresa la siguiente instrucción:

    Get me the top 10 most popular names in 1980
    

    El lienzo de datos de BigQuery genera una consulta similar a la que se muestra a continuación:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Cuando ejecutas la consulta, obtienes una tabla con los diez nombres más comunes de niños nacidos en 1980.

Crea y edita un gráfico

  1. En el lienzo de datos, haz clic en Visualizar.

    El lienzo de datos de BigQuery sugiere varias opciones de visualización, como gráfico de barras, gráfico circular, gráfico de líneas y visualización personalizada.

  2. En este ejemplo, haz clic en Crear gráfico de barras.

    El lienzo de datos de BigQuery crea un gráfico de barras similar al siguiente:

    Gráfico de barras de los diez nombres más populares.

Además de proporcionar un gráfico, el lienzo de datos de BigQuery resume algunos de los detalles clave de los datos que respaldan la visualización. Para modificar el gráfico, haz clic en Detalles de visualización y edita el gráfico en el panel lateral.

Instrucción 4: Edita los detalles de la visualización

  1. En el campo de instrucción Visualización, ingresa lo siguiente:

    Create a bar chart sorted high to low, with a gradient
    

    El lienzo de datos de BigQuery crea un gráfico de barras similar al siguiente:

    Gráfico de barras de nombres principales ordenados.

  2. Opcional: Para realizar más cambios, haz clic en Editar.

    Aparecerá el panel Editar visualización. Puedes editar detalles, como el título del gráfico, el nombre del eje x y el nombre del eje y. Además, si haces clic en la pestaña Editor de JSON, puedes editar directamente el gráfico según los valores JSON.

Cómo ver todos los lienzos de datos

Para ver una lista de todos los lienzos de datos de tu proyecto, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página BigQuery.

    Ir a BigQuery

  2. En el panel Explorador, haz clic en Ver acciones junto a Lienzos de datos y, luego, realiza una de las siguientes acciones:

  • Para abrir la lista en la pestaña actual, haz clic en Mostrar todo.
  • Para abrir la lista en una pestaña nueva, haz clic en Mostrar todo en > Pestaña nueva.
  • Para abrir la lista en una pestaña dividida, haz clic en Mostrar todo en > Pestaña dividida.

Cómo ver los metadatos del lienzo de datos

Para ver los metadatos del lienzo de datos, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página BigQuery.

    Ir a BigQuery

  2. En el panel Explorador, expande tu proyecto y la carpeta Lienzos de datos y, si es necesario, la carpeta Lienzos de datos compartidos. Haz clic en el nombre del lienzo de datos del que quieres ver los metadatos.

  3. Mira el panel Resumen para ver información sobre el lienzo de datos, como la región que usa y la fecha en la que se modificó por última vez.

Trabaja con versiones del lienzo de datos

Puedes ver, comparar y restablecer versiones de un lienzo de datos.

Cómo ver y comparar versiones del lienzo de datos

Para ver diferentes versiones de un lienzo de datos y compararlas con la versión actual, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página BigQuery.

    Ir a BigQuery

  2. En el panel Explorador, expande tu proyecto y la carpeta Lienzos de datos y, si es necesario, la carpeta Lienzos de datos compartidos. Haz clic en el nombre del lienzo de datos del que quieres ver la actividad.

  3. Haz clic en la pestaña Actividad para ver una lista de las versiones del lienzo de datos en orden descendente por fecha.

  4. Haz clic en Ver acciones junto a la versión de un lienzo de datos y, luego, en Comparar. Se abrirá el panel de comparación y se comparará la versión del lienzo de datos que seleccionaste con la versión actual del lienzo de datos.

  5. Opcional: Para comparar las versiones intercaladas en lugar de en paneles separados, haz clic en Comparar y, luego, en Intercalado.

Cómo restablecer una versión de un lienzo de datos

Usa una de las siguientes opciones para restablecer una versión del lienzo de datos. Restablecer desde el panel de comparación te permite comparar la versión anterior del lienzo de datos con la versión actual antes de decidir si restablecerla.

Panel de actividad

  1. En el panel Explorador, expande tu proyecto y la carpeta Lienzos de datos y, si es necesario, la carpeta Lienzos de datos compartidos. Haz clic en el nombre del lienzo de datos del que quieres restablecer una versión anterior.
  2. Selecciona el panel Actividad.
  3. Haz clic en Ver acciones junto a la versión del lienzo de datos que quieres restablecer y, luego, en Restablecer.
  4. Haz clic en Confirmar para confirmar la acción.

Panel de comparación

  1. En el panel Explorador, expande tu proyecto y la carpeta Lienzos de datos y, si es necesario, la carpeta Lienzos de datos compartidos. Haz clic en el nombre del lienzo de datos del que quieres restablecer una versión anterior.
  2. Selecciona el panel Actividad.
  3. Haz clic en Ver acciones junto a la versión de un lienzo de datos y, luego, en Comparar. Se abrirá el panel de comparación y se comparará la versión del lienzo de datos que seleccionaste con la versión más reciente del lienzo de datos.
  4. Si deseas restablecer la versión anterior del lienzo de datos después de la comparación, haz clic en Restablecer.
  5. Haz clic en Confirmar para confirmar la acción.

Precios

Para obtener detalles sobre los precios de esta función, consulta la descripción general de los precios de Gemini en BigQuery.

Cuotas y límites

Si deseas obtener más información sobre las cuotas y los límites de esta función, consulta Cuotas de Gemini en BigQuery.

Proporcionar comentarios

Para ayudar a mejorar las sugerencias de lienzo de datos de BigQuery, envía comentarios a Google. Para enviar comentarios, haz lo siguiente:

  1. En la barra de herramientas de la consola de Google Cloud, haz clic en Enviar comentarios.

  2. Opcional: Para copiar la información del DAG JSON y proporcionar contexto adicional a tus comentarios, haz clic en Copiar.

  3. Para completar el formulario y enviar comentarios, haz clic en formulario.

La configuración de uso compartido de datos se aplica a todo el proyecto y solo puede establecerla un administrador de proyecto con los permisos serviceusage.services.enable y serviceusage.services.list de IAM. Para obtener más información sobre el uso de datos en el programa de Verificador de confianza, consulta Gemini en el programa de Verificador de confianza de Google Cloud.

Para enviar comentarios directos sobre esta función, también puedes comunicarte con datacanvas-feedback@google.com.

¿Qué sigue?