在 Gemini 中分析数据以获取 Google Cloud 协助

本教程介绍如何使用适用于 Google Cloud 的 Gemini 来分析数据。Google Cloud 是 Google Cloud 中由 AI 赋能的协作工具。在本教程中,您将在 BigQuery 中使用 Gemini 来分析和预测产品销售。

本教程假定您熟悉 SQL 和基本的数据分析任务。假定您了解 Google Cloud 产品。如果您刚开始接触 BigQuery,请参阅 BigQuery 快速入门

目标

  • 请使用 Gemini 回答有关 Google Cloud 数据分析产品和应用场景的问题。
  • 提示 Gemini 在 BigQuery 中解释和生成 SQL 查询。
  • 构建机器学习 (ML) 模型来预测未来周期。

费用

本教程使用 Google Cloud 的以下收费组件:

您可以使用价格计算器根据您的预计使用情况来估算费用。

准备工作

  1. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  2. 在 Google Cloud 项目中,确保您已在 BigQuery 中设置 Gemini
  3. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  4. 创建一个名为 bqml_tutorial 的数据集。您可以使用数据集来存储数据库对象,包括表和模型。

  5. 在 BigQuery 中启用您需要完成本教程的 Gemini 功能:

    1. 如需在 BigQuery 中查看 Gemini 功能,请在工具栏中点击 pen_spark Gemini

    2. BigQuery SQL 编辑器中的 Genmini 列表中,选择以下所有选项:

      • 自动补全
      • 自动生成
      • 说明

    如需在 BigQuery 中停用 Gemini 功能,请取消选择要停用的 Gemini 功能。

使用 Gemini 分析数据

Gemini 可帮助您了解可以访问哪些数据进行分析,以及如何分析这些数据。

您需要先了解可以访问哪些数据,然后才能查询数据。每种数据产品的组织和存储数据的方式各不相同。如需获取帮助,您可以向 Gemini 发送自然语言语句(或提示),例如“如何在 BigQuery 中查看我可以使用哪些数据集和表?”

如果您想了解不同数据查询系统的特征,可以提示 Gemini 提供特定产品信息,如下所示:

  • “如何开始使用 BigQuery?”
  • “使用 BigQuery 进行数据分析有哪些好处?”
  • “BigQuery 如何处理查询的自动扩缩?”

Gemini 也可以提供有关如何分析数据的信息。对于此类帮助,您可以发送 Gemini 提示,如下所示:

  • “如何在 BigQuery 中创建时序预测模型?”
  • “如何将不同类型的数据加载到 BigQuery 中?”

如需提示 Gemini 回答与您的数据相关的问题,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在 Google Cloud 控制台工具栏中,点击 spark 打开 Gemini

  3. Gemini 窗格中,输入 How do I learn which datasets and tables are available to me in BigQuery? 之类的提示。

  4. 点击发送 发送提示

    Gemini 不会将您的提示或其回答作为数据来训练模型。如需了解详情,请参阅 Gemini for Google Cloud 如何使用您的数据

    Gemini 会返回类似于以下内容的响应:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. 可选:如要重置聊天记录,请在 Gemini 窗格中点击删除图标,然后点击重置聊天

使用 Gemini 了解和编写 BigQuery 中的 SQL

Gemini 可帮助您使用 SQL。例如,如果您使用其他人编写的 SQL 查询,BigQuery 中的 Gemini 可以用通俗易懂的语言解释复杂查询。此类说明有助于您了解查询语法、底层架构和业务情境。

提示 Gemini 解释销售数据集中的 SQL 查询

如需提示 Gemini 解释示例 SQL 查询,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在查询编辑器中,打开或粘贴您要解释的查询。

    例如,您可能希望了解数据表和查询与销售数据集之间的关系,并且可能需要帮助编写使用该数据集的查询。在以下示例查询中,您可能已经了解正在使用哪些表,但查询的其他部分可能需要一些时间才能解析和理解。

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. 突出显示您希望 Gemini 说明的查询,然后点击 pen_spark 说明此查询

    SQL 解释会显示在 Gemini 窗格中。

    使用上一步中的示例查询,Gemini 返回了类似如下的说明:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

生成按日期和产品对销售进行分组的 SQL 查询

您可以向 Gemini 提供提示,让其根据数据的架构生成 SQL 查询。即使您最初没有编写代码,对数据架构了解有限,或仅对 SQL 语法有基本的了解,Gemini 也可以建议一条或多条 SQL 语句。

在以下示例中,您将生成一个查询,其中会列出每天的热门产品。此类查询通常比较复杂,但使用 Gemini,您可以自动创建语句。然后,您可以使用 thelook_ecommerce 数据集内的表,并提示 Gemini 生成查询,以便按订单商品和产品名称计算销售额。

如需提示 Gemini 生成列出您的热门商品的查询,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    转到 BigQuery

  2. 在导航菜单中,点击 BigQuery Studio

  3. 点击 编写新查询探索器窗格会自动加载所选数据库。

  4. 在查询编辑器中,输入以下提示,然后按 Enter。井号字符 (#) 会提示 Gemini 生成 SQL。

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini 会建议如下所示的 SQL 查询:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. 如需接受建议的代码,请点击 Tab,然后点击运行以执行 SQL 语句。您也可以滚动浏览建议的 SQL,并接受语句中建议的特定字词。

  6. 查询结果窗格中,查看查询结果。

构建预测模型并查看结果

在本部分中,您将使用 BigQuery ML 执行以下操作:

  • 使用趋势查询构建预测模型。
  • 使用 Gemini 说明并帮助您编写查询以查看预测模型的结果。

您会将以下示例查询与实际销售情况结合使用,并将其用作模型的输入。查询会用作机器学习模型的创建的一部分。

  1. 如需创建预测机器学习模型,请在 BigQuery SQL 编辑器中运行以下 SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    您可以使用 Gemini 帮助理解此查询

    创建模型后,Results 窗格会显示类似如下的消息:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Gemini 窗格中,输入 Gemini 提示,以帮助您编写查询,以获取模型完成的预测。例如,输入 How can I get a forecast in SQL from the model?

    根据提示的上下文,Gemini 会返回一个预测销售情况的机器学习模型示例:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Gemini 窗格中,复制 SQL 查询。

  4. 在 BigQuery SQL 编辑器中,粘贴此 SQL 查询,然后运行该查询。

清理

为避免系统因本教程中使用的资源向您的 Google Cloud 帐号收取费用,您可以删除为本教程创建的 Google Cloud 项目。或者,您也可以删除各个资源。

  1. 在 Google Cloud 控制台中,进入管理资源页面。

    转到“管理资源”

  2. 在项目列表中,选择要删除的项目,然后点击删除
  3. 在对话框中输入项目 ID,然后点击关闭以删除项目。

删除数据集

删除项目也将删除项目中的所有数据集和所有表。如果您希望重复使用该项目,则可以删除在本教程中创建的数据集。

  1. 在 Google Cloud 控制台中,打开 BigQuery 页面。

    转到 BigQuery

  2. 在导航栏中,选择您创建的 bqml_tutorial 数据集。

  3. 如需删除数据集、表和所有数据,请点击删除数据集

  4. 如需确认删除,请在删除数据集对话框中输入数据集的名称 (bqml_tutorial),然后点击删除

后续步骤