Analizar datos con la ayuda de Gemini
En este tutorial se describe cómo puedes usar la asistencia basada en IA de Gemini en BigQuery para analizar datos.
En el ejemplo de este tutorial, supongamos que eres un analista de datos que necesita analizar y predecir las ventas de productos a partir de un conjunto de datos.
En este tutorial se da por supuesto que tienes conocimientos sobre SQL y tareas básicas de analíticas de datos. No se presupone que tengas conocimientos sobre los productos de Google Cloud . Si es la primera vez que usas BigQuery, consulta las guías de inicio rápido de BigQuery.
Objetivos
- Usa Gemini en BigQuery para responder preguntas sobre cómo gestiona BigQuery tareas de análisis de datos específicas.
- Pide a Gemini en BigQuery que busque conjuntos de datos y que explique y genere consultas SQL.
- Crea un modelo de aprendizaje automático para predecir periodos futuros.
Costes
En este tutorial se utilizan los siguientes productos de pago: Google Cloud
Para estimar los costes en función del uso previsto, usa la calculadora de precios.
Antes de empezar
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
- Asegúrate de que Gemini en BigQuery esté configurado en tu Google Cloud proyecto.
En la Google Cloud consola, ve a la página BigQuery.
Crea un conjunto de datos llamado
bqml_tutorial
. El conjunto de datos se usa para almacenar objetos de la base de datos, como tablas y modelos.Para activar las funciones de Gemini en BigQuery que necesitas para completar este tutorial, en la barra de herramientas de BigQuery, haz clic en pen_spark Gemini y, a continuación, selecciona las siguientes opciones:
- Autocompletar
- Generación automática
- Explicación
Información sobre las funciones de BigQuery
Antes de empezar, ten en cuenta que quieres obtener más información sobre cómo gestiona BigQuery las consultas de datos. Para obtener ayuda, puede enviar a Gemini en BigQuery una petición en lenguaje natural (o petición) como la siguiente:
- "¿Cómo puedo empezar a usar BigQuery?"
- "¿Cuáles son las ventajas de usar BigQuery para analizar datos?"
- "¿Cómo gestiona BigQuery el autoescalado de las consultas?"
Gemini en BigQuery también puede proporcionar información sobre cómo analizar tus datos. Para obtener ese tipo de ayuda, puedes enviar peticiones como las siguientes:
- "¿Cómo puedo crear un modelo de previsión de series temporales en BigQuery?"
- "¿Cómo puedo cargar diferentes tipos de datos en BigQuery?"
Acceder y analizar datos
Gemini en BigQuery puede ayudarte a saber qué datos puedes consultar para analizarlos y cómo hacerlo.
En este ejemplo, supongamos que necesitas ayuda con lo siguiente:
- Buscar conjuntos de datos y tablas de ventas para analizarlos.
- Saber cómo se relacionan las tablas de datos y las consultas en un conjunto de datos de ventas.
- Entender consultas complejas y escribir consultas que usen el conjunto de datos.
Buscar datos
Antes de consultar datos, debes saber a qué datos puedes acceder. Cada producto de datos organiza y almacena los datos de forma diferente.
Para obtener ayuda, puedes enviar a Gemini en BigQuery una petición como "¿Cómo puedo saber qué conjuntos de datos y tablas tengo disponibles en BigQuery?".
En la Google Cloud consola, ve a la página BigQuery.
En la barra de herramientas de la consola, haz clic en chispa Abrir o cerrar chat de Gemini Cloud Assist. Google Cloud
En el panel Cloud Assist, escribe la petición
How do I learn which datasets and tables are available to me in BigQuery?
.Haz clic en send Enviar petición.
Consulta cómo y cuándo Gemini Google Cloud usa tus datos.
La respuesta incluye varias formas de enumerar proyectos, conjuntos de datos o tablas de un conjunto de datos.
Opcional: Para restablecer tu historial de chat, en el panel Asistencia en la nube, haz clic en delete Borrar chat y, a continuación, en Restablecer chat.
Entender y escribir código SQL en BigQuery
En este ejemplo, supongamos que ha seleccionado los datos que quiere analizar y ahora quiere consultar esos datos. Gemini en BigQuery puede ayudarte a trabajar con SQL, ya sea para entender consultas complejas y difíciles de analizar o para generar nuevas consultas de SQL.
Pedir ayuda a Gemini para explicar consultas SQL
Supongamos que quieres entender una consulta compleja que ha escrito otra persona. Gemini en BigQuery puede explicar la consulta en lenguaje natural, como la sintaxis de la consulta, el esquema subyacente y el contexto empresarial.
En la Google Cloud consola, ve a la página BigQuery.
En el editor de consultas, abre o pega la consulta que quieras que se explique. Por ejemplo:
SELECT u.id AS user_id, u.first_name, u.last_name, avg(oi.sale_price) AS avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` AS u JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi ON u.id = oi.user_id GROUP BY 1, 2, 3 ORDER BY avg_sale_price DESC LIMIT 10
Resalta la consulta y, a continuación, haz clic en auto_awesome Explica esta consulta seleccionada.
En el panel Asistencia en la nube, se devuelve una respuesta similar a la siguiente:
The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id, first_name, and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
Generar una consulta de SQL que agrupe las ventas por día y producto
En este ejemplo, quieres generar una consulta que muestre los productos más vendidos de cada día. Después, usas las tablas del conjunto de datos thelook_ecommerce
y le pides a Gemini en BigQuery que genere una consulta para calcular las ventas por artículo y por nombre de producto.
Este tipo de consulta suele ser complejo, pero, si usas Gemini en BigQuery, puedes crear una instrucción automáticamente. Puedes proporcionar una petición para generar una consulta de SQL basada en el esquema de tus datos. Aunque no tengas experiencia en programación, tengas un conocimiento limitado del esquema de datos o solo tengas conocimientos básicos de la sintaxis de SQL, la asistencia de Gemini puede sugerirte una o varias declaraciones SQL.
Para pedirle a Gemini en BigQuery que genere una consulta que muestre tus productos más vendidos, sigue estos pasos:
En la Google Cloud consola, ve a la página BigQuery.
En el menú de navegación, haz clic en Studio.
Haz clic en
Consulta de SQL. En el panel Explorador se carga automáticamente la base de datos seleccionada.En el editor de consultas, escribe la siguiente petición y pulsa Intro:
# select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
El carácter de libra (
#
) indica a Gemini en BigQuery que genere código SQL. Gemini en BigQuery sugiere una consulta de SQL similar a la siguiente:SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
Para aceptar el código sugerido, haz clic en Tabulador y, a continuación, en Ejecutar para ejecutar la instrucción SQL. También puedes desplazarte por el SQL sugerido y aceptar palabras concretas sugeridas en la instrucción.
En el panel Resultados de la consulta, consulta los resultados de la consulta.
Crear un modelo de previsión y ver los resultados
En este ejemplo, usará BigQuery ML para hacer lo siguiente:
- Usa una consulta de tendencias para crear un modelo de previsión.
- Usa Gemini en BigQuery para explicarte y ayudarte a escribir una consulta para ver los resultados del modelo de previsión.
Usa la siguiente consulta de ejemplo con las ventas reales, que se utilizan como entrada para el modelo. La consulta se usa como parte de la creación del modelo de aprendizaje automático.
Para crear un modelo de aprendizaje automático de previsión, en el editor de consultas, ejecuta la siguiente consulta de SQL:
CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS', time_series_timestamp_col = 'date_col', time_series_data_col = 'total_sales', time_series_id_col = 'product_id') AS SELECT sum(sale_price) AS total_sales, DATE(created_at) AS date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;
Puedes usar Gemini en BigQuery para entender esta consulta.
Cuando se crea el modelo, en la pestaña Resultados del panel Resultados de la consulta se muestra un mensaje similar al siguiente:
Successfully created model named sales_forecasting_model.
En el panel Asistencia de Cloud, introduce una petición para que Gemini en BigQuery te ayude a escribir una consulta para obtener una previsión del modelo cuando se haya completado. Por ejemplo, introduce
How can I get a forecast in SQL from the model?
En función del contexto de la petición, la respuesta incluye un ejemplo de modelo de aprendizaje automático que predice las ventas:
SELECT * FROM ML.FORECAST( MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`, STRUCT( 7 AS horizon, 0.95 AS confidence_level))
En esta respuesta,
PROJECT_ID
es tuGoogle Cloud proyecto.En el panel Cloud Assist, copia la consulta SQL.
En el editor de consultas, ejecuta la consulta de SQL.
Limpieza
Para evitar que se apliquen cargos en tu cuenta Google Cloud por los recursos utilizados en este tutorial, puedes eliminar el proyecto Google Cloud que has creado para este tutorial. También puedes eliminar los recursos de forma individual.
Eliminar proyecto
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Eliminar un conjunto de datos
Si eliminas un proyecto, se eliminarán todos los conjuntos de datos y todas las tablas que contenga. Si prefieres reutilizar el proyecto, puedes eliminar el conjunto de datos que has creado en este tutorial.
En la Google Cloud consola, ve a la página BigQuery.
En el menú de navegación, selecciona el conjunto de datos
bqml_tutorial
que has creado.Para eliminar el conjunto de datos, la tabla y todos los datos, haz clic en Eliminar conjunto de datos.
Para confirmar la eliminación, en el cuadro de diálogo Eliminar conjunto de datos, escribe el nombre del conjunto de datos (
bqml_tutorial
) y, a continuación, haz clic en Eliminar.
Siguientes pasos
- Consulta la descripción general de Gemini para Google Cloud .
- Consulta las cuotas y los límites de Gemini para Google Cloud .
- Consulta las ubicaciones de Gemini para Google Cloud.
- Consulta cómo explorar tus datos generando estadísticas.
- Consulta más información sobre cómo escribir consultas con la ayuda de Gemini en BigQuery.