使用数据画布进行分析

如需提供有关 BigQuery 数据画布的反馈或请求支持,请发送电子邮件至 datacanvas-feedback@google.com

BigQuery 数据画布可让您使用自然语言探索、转换、查询和直观呈现数据。BigQuery 数据画布提供了一个用于分析的图形界面,让您可在有向无环图 (DAG) 中处理数据源、查询和可视化,从而提供与您的思维模型相对应的分析工作流图形视图。在 BigQuery 数据画布中,您可以迭代查询结果,并在一个位置处理多个查询分支。

BigQuery 数据画布旨在帮助您完成从数据到洞见的历程。您无需具备特定工具或产品的技术知识即可处理数据。BigQuery 数据画布与 Dataplex 元数据搭配使用,以根据自然语言确定适当的表。

BigQuery 数据画布使用 Gemini 查找数据、创建 SQL、生成图表以及创建数据摘要。

功能

BigQuery 数据画布支持以下功能:

  • 关键字搜索语法与 Dataplex 元数据(例如表、视图或具体化视图)搭配使用来查找表资产。

  • 使用自然语言来执行简单的 SQL 查询,例如:

    • 使用 SELECT FROM、数学函数、数组和结构体的查询
    • 两个表之间的 JOIN 语句
  • 常见的可视化效果,包括以下图表类型:

    • 条形图
    • 热图
    • 线形图
    • 饼图
    • 散点图
  • 自定义可视化,您可以使用自然语言来描述您想要的内容。

  • 自动生成数据分析。

BigQuery 数据画布存在以下限制:

  • 在使用以下各项时,自然语言命令可能无法使用:

    • BigQuery ML
    • Apache Spark
    • 对象表
    • BigLake
    • INFORMATION_SCHEMA
    • JSON
    • 嵌套和重复字段
    • 复杂的函数和数据类型,例如 DATETIMETIMEZONE
  • 数据可视化功能不适用于地理图图表。

准备工作

如需在 BigQuery 功能中访问 Gemini,管理员必须在 BigQuery 中启用 Gemini。如需了解详情,请参阅在 BigQuery 中设置 Gemini

如需获得使用 BigQuery 数据画布所需的权限,请让管理员向您授予项目的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理访问权限

您也可以通过自定义角色或其他预定义角色来获取所需的权限。

使用 BigQuery 数据画布

BigQuery 数据画布可让您使用自然语言推进方法探索、转换、查询和直观呈现数据。以下示例演示了与 BigQuery 数据画布交互的一些方式,包括从数据发现到可视化的示例工作流。

若要开始使用 BigQuery 数据画布,请执行以下操作:

  1. 转到 Google Cloud 控制台。

    转到 BigQuery

  2. 在导航菜单中,点击 BigQuery Studio

  3. 点击 创建数据画布。您还可以直接从表或查询启动 BigQuery 数据画布。

  4. 在文本字段中输入自然语言的第一个提示。

示例

以下示例演示了典型的 BigQuery 数据画布工作流。

示例 1:处理单个表

提示 1:查找数据

Chicago taxi trips

可能的结果

BigQuery 数据画布会根据 Dataplex 元数据生成潜在表列表。您可以选择多个表。每个表都有添加到画布查询详情选项。在本示例中,我们将选择 bigquery-public-data.chicago_taxi_trips.taxi_trips 表,然后点击添加到画布

taxi_trips 的表单元格会添加到 BigQuery 数据画布中。您可以循环浏览表单元格中的各个标签页,以查看架构信息、表详细信息和数据预览。

点击查询,使用自然语言查询此表。

提示 2:使用所选表创建 SQL 查询

Get me the 100 longest trips

可能的结果

BigQuery 数据画布生成类似于以下内容的 SQL 查询:

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

您还可以通过手动修改 SQL 查询或更改自然语言提示并重新生成查询来修改查询。在本示例中,我们将修改自然语言提示,以仅选择客户使用现金付款的行程。

提示 3:通过更改提示来修改查询

Get me the 100 longest trips where the payment type is cash

可能的结果

BigQuery 数据画布生成类似于以下内容的 SQL 查询:

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `daui-storage.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

点击运行以查看查询结果。

提示 4:创建图表

  1. 点击可视化
  2. 点击创建条形图

可能的结果

BigQuery 数据画布会创建一个条形图,按行程 ID 显示最长行程里程数。

BigQuery 数据画布除了提供图表之外,还汇总了支持可视化的数据的一些关键详细信息。若要修改图表,您可以点击可视化详情并在侧边栏中修改图表。

若要共享 BigQuery 数据画布,请点击共享,然后点击共享链接以复制 BigQuery 数据画布链接。

若要清理 BigQuery 数据画布,请点击清除画布。这样,你将得到空白画布。

示例 2:处理多个表

提示 1

Information about trees

可能的结果

BigQuery 数据画布会推荐几个包含树相关信息的表。在此示例中,我们将使用两个表:bigquery-public-data.new_york_trees.tree_census_1995bigquery-public-data.new_york_trees.tree_census_2015

选择这两个表后,它们会显示在画布上。

在此示例中,点击 bigquery-public-data.new_york_trees.tree_census_1995 表上的联接以联接两个表。BigQuery 数据画布会建议要联接的表。选中 bigquery-public-data.new_york_trees.tree_census_2015。此时会显示一个新窗格,其中包含与每个表的连接。

提示 2:

Join these tables on their address

可能的结果

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

BigQuery 数据画布建议 SQL 查询在地址上联接这两个表。点击运行以运行查询并查看结果。

借助 BigQuery 数据画布,您可以将查询导出为笔记本。若要导出到笔记本,请执行以下操作:

  1. 点击导出为笔记本标签页。
  2. 在“保存笔记本”窗格中,输入保存笔记本时为其使用的名称和区域。
  3. 点击保存。笔记本已成功创建。
  4. 点击在 BQ Studio 中打开以查看创建的笔记本。

示例 3

提示 1

Find data about USA names

可能的结果

BigQuery 数据画布会生成表列表。在此示例中,我们将选择 bigquery-public-data.usa_names.usa_1910_current 表。

点击查询以查询数据。输入提示以查询数据。

可能的结果

BigQuery 数据画布生成以下查询:

SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`

BigQuery 数据画布会生成查询结果。我们将要求使用另一个查询来过滤此数据。点击查询这些结果

提示 2

Get me the top 10 most popular names in 1980

可能的结果

BigQuery 数据画布生成以下查询:

SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;

运行查询后,我们会得到一个表,其中包含 1980 年新生儿使用最多的 10 个名字。

在此示例中,我们将直观呈现这些结果。点击可视化。BigQuery 数据画布会推荐几个可视化选项,包括条形图、饼图、折线图和自定义可视化。点击创建条形图

BigQuery 数据画布会创建一个类似如下的条形图:

使用最多的 10 个名字的条形图。

BigQuery 数据画布除了提供图表之外,还汇总了支持可视化的数据的一些关键详细信息。若要修改图表,您可以点击可视化详情并在侧边栏中修改图表。

提示 3

Create a bar chart sorted high to low, with a gradient

可能的结果

BigQuery 数据画布会创建一个类似如下的条形图:

使用最多的 10 个名字的已排序条形图。

如需进行其他更改,请点击可视化详情。此时会显示 Vis 详细信息边栏。您可以修改图表标题、x 轴名称、y 轴名称等。此外,如果点击 JSON 标签页,您可以根据 JSON 值直接修改图表。

价格

使用 BigQuery 数据画布时,您需要根据基于计算或存储的价格模式付费。在预览版期间,将 Gemini 与 BigQuery 数据画布搭配使用不会产生额外费用。

提供反馈

您可以通过向 Google 提交反馈,帮助改进 BigQuery 数据画布建议。若要提供反馈,请按以下步骤操作:

  1. 在 Google Cloud 控制台的工具栏中,点击提交反馈

  2. 可选:点击 复制以复制 DAG JSON 信息,为您的反馈提供更多上下文。

  3. 点击表单并填写表单,以提供反馈。

数据共享设置适用于整个项目,且只能由拥有 serviceusage.services.enableserviceusage.services.list IAM 权限的项目管理员设定。如需详细了解可信测试员计划中的数据使用方式,请参阅 Google Cloud 中的 Gemini 可信测试员计划

您还可以联系 datacanvas-feedback@google.com 以直接提供有关此功能的反馈。

后续步骤