借助 Gemini 来分析数据,让 Google Cloud 助您一臂之力

本教程介绍如何使用 Google Cloud 专用 Gemini(Google Cloud 的 AI 赋能的协作工具)来分析数据。在本教程中,您将使用 BigQuery 中的 Gemini 来分析和预测产品销售情况。

本教程假定您熟悉 SQL 和基本的数据分析任务。您不一定要了解 Google Cloud 产品。如果您刚开始接触 BigQuery,请参阅 BigQuery 快速入门

目标

  • 使用 Gemini 回答有关 Google Cloud 数据分析产品和应用场景的问题。
  • 提示 Gemini 在 BigQuery 中解释和生成 SQL 查询。
  • 构建机器学习 (ML) 模型,预测未来周期。

费用

本教程使用 Google Cloud 的以下收费组件:

您可使用价格计算器根据您的预计用量来估算费用。

准备工作

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. 在 Google Cloud 项目中,确保您已在 BigQuery 中设置 Gemini
  3. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  4. 创建一个名为 bqml_tutorial 的数据集。您可以使用数据集来存储数据库对象,包括表和模型。

  5. 在 BigQuery 中启用完成本教程所需的 Gemini 功能:

    1. 如需在 BigQuery 中查看 Gemini 功能,请在工具栏中点击 pen_spark Gemini

    2. BigQuery SQL 编辑器中的 Gemini 列表中,选择以下所有选项:

      • 自动补全
      • 自动生成
      • 说明

    如需在 BigQuery 中停用 Gemini 功能,请取消选中要停用的 Gemini 功能。

使用 Gemini 分析数据

Gemini 可以帮助您了解您可以访问哪些数据进行分析,以及如何分析这些数据。

在查询数据之前,您需要知道自己可以访问哪些数据。每种数据产品都以不同的方式组织和存储数据。如需获取帮助,你可以向 Gemini 发送自然语言语句(或提示),例如“如何在 BigQuery 中查看我可以使用哪些数据集和表?”

如果您想了解不同数据查询系统的特征,可以提示 Gemini 提供如下特定产品信息:

  • “如何开始使用 BigQuery?”
  • “使用 BigQuery 进行数据分析有什么好处?”
  • “BigQuery 如何处理查询的自动扩缩?”

Gemini 还可以提供有关如何分析数据的信息对于这类帮助,你可以发送 Gemini 提示,例如:

  • “如何在 BigQuery 中创建时序预测模型?”
  • “如何将不同类型的数据加载到 BigQuery 中?”

如需提示 Gemini 回答有关你数据的问题,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在 Google Cloud 控制台工具栏中,点击 spark 打开 Gemini

  3. Gemini 窗格中,输入类似 How do I learn which datasets and tables are available to me in BigQuery? 的提示。

  4. 点击发送 发送提示

    了解 Google Cloud 专用 Gemini 使用数据的方式和时间

    Gemini 给出的回答可能类似于以下内容:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. 可选:如要重置聊天记录,请在 Gemini 窗格中点击删除图标,然后点击重置对话

使用 Gemini 在 BigQuery 中理解和编写 SQL

Gemini 可以帮助您使用 SQL。例如,如果您使用其他人编写的 SQL 查询,BigQuery 中的 Gemini 可以使用通俗易懂的语言解释复杂查询。此类说明有助于您了解查询语法、底层架构和业务上下文。

输入提示,让 Gemini 解释在销售数据集中如何使用 SQL 查询

如需提示 Gemini 解释示例 SQL 查询,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在查询编辑器中,打开或粘贴您要解释的查询。

    例如,您可能想要了解销售数据集中数据表和查询之间的关系,并且可能需要一些帮助来编写使用该数据集的查询。在以下示例查询中,您可能了解了所使用的表,但查询的其他部分可能需要一些时间来解析和理解。

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. 突出显示您希望 Gemini 解释的查询,然后点击 pen_spark 解释此查询

    SQL 说明会显示在 Gemini 窗格中。

    使用上一步中的示例查询,Gemini 返回类似于以下内容的说明:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

生成 SQL 查询,按天和产品对销售额进行分组

您可以向 Gemini 提供提示,让其根据数据架构生成 SQL 查询。即使您刚开始时没有编写任何代码,或者对数据架构了解有限,或者只掌握了 SQL 语法的基本知识,Gemini 也可以提供一个或多个 SQL 语句的建议。

在以下示例中,您将生成列出每天的热门商品的查询。这种类型的查询通常很复杂,但使用 Gemini,您可以自动创建语句。然后,使用 thelook_ecommerce 数据集中的表,并提示 Gemini 生成按订单商品和产品名称计算销售额的查询。

如需提示 Gemini 生成列出您热门商品的查询,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在导航菜单中,点击 BigQuery Studio

  3. 点击 编写新查询探索器窗格会自动加载所选数据库。

  4. 在查询编辑器中,输入以下提示,然后按 Enter。井号 (#) 会提示 Gemini 生成 SQL。

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini 建议的 SQL 查询可能类似于以下内容:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. 如需接受建议的代码,请点击 Tab,然后点击运行以执行 SQL 语句。您也可以滚动浏览建议的 SQL,并接受语句中建议的特定字词。

  6. 查询结果窗格中,查看查询结果。

构建预测模型并查看结果

在本部分中,您将使用 BigQuery ML 执行以下操作:

  • 使用趋势查询构建预测模型。
  • 使用 Gemini 解释和帮助您编写查询,以查看预测模型的结果。

以下示例查询将用作模型的输入,其中包含实际销售情况。该查询是创建 ML 模型的一部分。

  1. 如需创建预测机器学习模型,请在 BigQuery SQL 编辑器中运行以下 SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    你可以使用 Gemini 来理解此查询

    创建模型后,Results 窗格将显示类似于以下内容的消息:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Gemini 窗格中,输入提示,让 Gemini 帮助你编写查询,以便在模型编写完成后获得预测结果。例如,输入 How can I get a forecast in SQL from the model?

    根据提示的上下文,Gemini 会返回一个用于预测销售额的机器学习模型示例:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Gemini 窗格中,复制 SQL 查询。

  4. 在 BigQuery SQL 编辑器中,粘贴并运行 SQL 查询。

清理

为避免系统因本教程中使用的资源向您的 Google Cloud 帐号收取费用,您可以删除为本教程创建的 Google Cloud 项目。或者,您也可以删除各个资源。

  1. 在 Google Cloud 控制台中,进入管理资源页面。

    转到“管理资源”

  2. 在项目列表中,选择要删除的项目,然后点击删除
  3. 在对话框中输入项目 ID,然后点击关闭以删除项目。

删除数据集

删除项目也将删除项目中的所有数据集和所有表。如果您希望重复使用该项目,则可以删除在本教程中创建的数据集。

  1. 在 Google Cloud 控制台中,打开 BigQuery 页面。

    转到 BigQuery

  2. 在导航菜单中,选择您创建的 bqml_tutorial 数据集。

  3. 如需删除数据集、表和所有数据,请点击删除数据集

  4. 如需确认删除,请在删除数据集对话框中,输入数据集的名称 (bqml_tutorial),然后点击删除

后续步骤