本教程介绍如何使用 Google Cloud 专用 Gemini,由 AI 赋能 Google Cloud 的协作工具,可用来分析数据。在本教程中,您将使用 BigQuery 中的 Gemini,以分析和预测产品销售情况。
本教程假定您熟悉 SQL 和基本数据分析 任务。您不一定要了解 Google Cloud 产品。如果您刚开始接触 请参阅 BigQuery 快速入门。
目标
- 使用 Gemini 回答有关 Google Cloud 的问题 数据分析产品和使用场景。
- 提示 Gemini 解释和生成 SQL 查询 BigQuery。
- 构建机器学习 (ML) 模型,预测未来周期。
费用
本教程使用 Google Cloud 的以下收费组件:
使用价格计算器,根据您的具体价格 预计使用情况。
准备工作
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
- 在 Google Cloud 项目中,确保您已在 BigQuery 中设置 Gemini。
在 Google Cloud 控制台中,转到 BigQuery 页面。
创建数据集 名为
bqml_tutorial
您可以使用数据集来存储数据库 包括表和模型。在 BigQuery 中启用 Gemini 功能, 您需要完成本教程:
如需在 BigQuery 中查看 Gemini 功能,请执行以下操作: 点击工具栏中的 pen_spark Gemini。
在 BigQuery SQL 编辑器中的 Gemini 列表中,选择所有 选项:
- 自动补全
- 自动生成
- 说明
如需在 BigQuery 中停用 Gemini 功能,请执行以下操作: 取消选择要停用的 Gemini 功能。
使用 Gemini 分析数据
Gemini 可帮助您了解您可以访问哪些数据 以及如何分析这些数据。
在查询数据之前,您需要知道自己可以访问哪些数据。所有数据 产品以不同的方式组织和存储数据。如需获取帮助,您可以 Gemini 自然语言语句(或提示),例如“如何查看 我可以在 BigQuery 中使用哪些数据集和表?”
如果您想了解不同数据查询系统的特征, 您可以提示 Gemini 提供具体产品信息,例如 以下:
- “如何开始使用 BigQuery?”
- “使用 BigQuery 进行数据分析有什么好处?”
- “BigQuery 如何处理查询的自动扩缩?”
Gemini 还可以提供相关信息,说明如何分析 数据。对于这类帮助,你可以发送 Gemini 问题,例如 如下所示:
- “如何在 Google 时序控制台中 BigQuery?”
- “如何将不同类型的数据加载到 BigQuery 中?”
若要提示 Gemini 回答有关你数据的问题,请按照 具体步骤:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在 Google Cloud 控制台工具栏中,点击 spark 打开 Gemini。
在 Gemini 窗格中,输入类似
How do I learn which datasets and tables are available to me in BigQuery?
的提示。点击 send SendPrompt。
了解 Gemini for Google Cloud 如何以及何时使用您的数据。
Gemini 给出的回答可能类似于以下内容:
To learn which datasets and tables are available to you in BigQuery, you can use the Google Cloud console, the Google Cloud CLI, or the BigQuery API. ...
可选:如要重置聊天记录,请在 Gemini 窗格中点击 delete 图标,然后点击重置对话。
使用 Gemini 在 BigQuery 中理解和编写 SQL
Gemini 可以帮助您使用 SQL。例如,如果你在公司工作 编写出基于文本的 Gemini BigQuery 能用通俗易懂的语言解释复杂查询。此类 解释功能可帮助您了解查询语法、底层架构和 业务情境。
输入提示,让 Gemini 解释在销售数据集中如何使用 SQL 查询
如需提示 Gemini 解释示例 SQL 查询,请按以下说明操作 步骤:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在查询编辑器中,打开或粘贴您要解释的查询。
例如,您可能想要了解数据表和查询是如何 销售数据集内相关事务,您可能想要帮忙编写使用 数据集。在以下示例查询中,您可能了解了 但查询的其他部分可能需要您花费时间 来解析和理解
SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` as u JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi ON u.id = oi.user_id GROUP BY 1,2,3 ORDER BY avg_sale_price DESC LIMIT 10
选中您希望 Gemini 解释的查询,然后 然后点击 pen_spark Explain this 查询。
SQL 说明会显示在 Gemini 窗格中。
使用上一步中的查询示例,Gemini 会返回类似于以下内容的说明:
The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id , first_name , and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
生成 SQL 查询,按天和产品对销售额进行分组
您可以向 Gemini 提供提示,让其生成 SQL 查询 根据数据架构进行定制即使您最初没有代码, 或者只对 SQL 语法有基本的了解, Gemini 可以建议一个或多个 SQL 语句。
在以下示例中,您将生成列出每天的热门商品的查询。
这种类型的查询通常很复杂,但使用 Gemini,你可以
自动创建语句然后,您可以使用 thelook_ecommerce
中的表
并提示 Gemini 生成查询来计算销售额
按订单项目和产品名称显示
提示 Gemini 生成列出你最常使用的查询 请按照以下步骤操作:
在 Google Cloud 控制台中,前往 BigQuery 页面。
在导航菜单中,点击 BigQuery Studio。
点击
编写新查询。 Explorer窗格会自动加载所选数据库。在查询编辑器中,输入以下提示,然后按 Enter 键。井号 (
#
) 提示 来生成 SQL。# select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
Gemini 建议的 SQL 查询可能类似于以下内容:
SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
如需接受建议的代码,请点击 Tab,然后点击运行 执行 SQL 语句。您也可以滚动浏览建议的 SQL 和 接受陈述中建议的特定字词。
在查询结果窗格中,查看查询结果。
构建预测模型并查看结果
在本部分中,您将使用 BigQuery ML 执行以下操作:
- 使用趋势查询构建预测模型。
- 使用 Gemini 解释和帮助您编写要查看的查询 预测模型运行后的结果。
您使用以下查询示例,了解实际销售额,这些数据用作 输入到模型中。该查询是创建 ML 模型的一部分。
如需创建预测机器学习模型,请在 BigQuery SQL 编辑器中执行以下操作: 运行以下 SQL:
CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS(MODEL_TYPE='ARIMA_PLUS', time_series_timestamp_col='date_col', time_series_data_col='total_sales', time_series_id_col='product_id') AS SELECT sum(sale_price) as total_sales, DATE(created_at) as date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;
你可以使用 Gemini 帮助了解这一点 搜索查询
创建模型后,结果窗格会显示类似如下的消息: 更改为以下代码:
This statement will replace the model named sales_forecasting_model. Depending on the type of model, this may take several hours to complete.
在 Gemini 窗格中,输入让 Gemini 提供帮助的提示 您可以编写查询,以在模型完成运行后获取预测结果。对于 示例,请输入
How can I get a forecast in SQL from the model?
Gemini 会根据提示的上下文,返回一个 预测销售额的机器学习模型示例:
To get a forecast in SQL from the model, you can use the following query: SELECT * FROM ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`, STRUCT( 7 AS horizon, 0.95 AS confidence_level ) )
在 Gemini 窗格中,复制 SQL 查询。
在 BigQuery SQL 编辑器中,粘贴并运行 SQL 查询。
清理
为避免系统因资源向您的 Google Cloud 账号收取费用 您可以删除之前使用的 Google Cloud 项目, 为本教程创建的映像或者,您也可以删除各个资源。
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
删除数据集
删除项目也将删除项目中的所有数据集和所有表。如果您 则可以删除您在创建数据集时 本教程。
在 Google Cloud 控制台中,打开 BigQuery 页面。
在导航菜单中,选择您创建的
bqml_tutorial
数据集。如需删除数据集、表和所有数据,请点击删除 数据集。
要确认删除,请在删除数据集对话框中, 数据集 (
bqml_tutorial
),然后点击删除。
后续步骤
了解 Gemini 配额和 限制。
了解 Gemini。