使用数据画布进行分析
如需提供有关 BigQuery 数据画布的反馈或请求支持,请发送电子邮件至 datacanvas-feedback@google.com。
BigQuery 数据画布可让您使用自然语言探索、转换、查询和直观呈现数据。BigQuery 数据画布提供了一个用于分析的图形界面,让您可在有向无环图 (DAG) 中处理数据源、查询和可视化,从而提供与您的思维模型相对应的分析工作流图形视图。在 BigQuery 数据画布中,您可以迭代查询结果,并在一个位置处理多个查询分支。
BigQuery 数据画布旨在帮助您完成从数据到洞见的历程。您无需具备特定工具或产品的技术知识即可处理数据。BigQuery 数据画布与 Dataplex 元数据搭配使用,以根据自然语言确定适当的表。
BigQuery 数据画布使用 Gemini 查找数据、创建 SQL、生成图表以及创建数据摘要。
功能
BigQuery 数据画布支持以下功能:
将关键字搜索语法与 Dataplex 元数据(例如表、视图或具体化视图)搭配使用来查找表资产。
使用自然语言来执行简单的 SQL 查询,例如:
- 使用
SELECT FROM
、数学函数、数组和结构体的查询 - 两个表之间的
JOIN
语句
- 使用
常见的可视化效果,包括以下图表类型:
- 条形图
- 热图
- 线形图
- 饼图
- 散点图
自定义可视化,您可以使用自然语言来描述您想要的内容。
自动生成数据分析。
BigQuery 数据画布存在以下限制:
在使用以下各项时,自然语言命令可能无法使用:
- BigQuery ML
- Apache Spark
- 对象表
- BigLake
- INFORMATION_SCHEMA
- JSON
- 嵌套和重复字段
- 复杂的函数和数据类型,例如
DATETIME
和TIMEZONE
数据可视化功能不适用于地理图图表。
准备工作
如需在 BigQuery 功能中访问 Gemini,管理员必须在 BigQuery 中启用 Gemini。如需了解详情,请参阅在 BigQuery 中设置 Gemini。
如需获得使用 BigQuery 数据画布所需的权限,请让管理员向您授予项目的以下 IAM 角色:
-
BigQuery Studio (
roles/bigquery.studioUser
) -
Cloud AI Companion User (
roles/cloudaicompanion.user
)
如需详细了解如何授予角色,请参阅管理访问权限。
使用 BigQuery 数据画布
BigQuery 数据画布可让您使用自然语言推进方法探索、转换、查询和直观呈现数据。以下示例演示了与 BigQuery 数据画布交互的一些方式,包括从数据发现到可视化的示例工作流。
若要开始使用 BigQuery 数据画布,请执行以下操作:
转到 Google Cloud 控制台。
在导航菜单中,点击 BigQuery Studio。
点击
创建数据画布。您还可以直接从表或查询启动 BigQuery 数据画布。在文本字段中输入自然语言的第一个提示。
示例
以下示例演示了典型的 BigQuery 数据画布工作流。
示例 1:处理单个表
提示 1:查找数据
Chicago taxi trips
可能的结果:
BigQuery 数据画布会根据 Dataplex 元数据生成潜在表列表。您可以选择多个表。每个表都有添加到画布、查询和详情选项。在本示例中,我们将选择 bigquery-public-data.chicago_taxi_trips.taxi_trips
表,然后点击添加到画布。
taxi_trips
的表单元格会添加到 BigQuery 数据画布中。您可以循环浏览表单元格中的各个标签页,以查看架构信息、表详细信息和数据预览。
点击查询,使用自然语言查询此表。
提示 2:使用所选表创建 SQL 查询
Get me the 100 longest trips
可能的结果:
BigQuery 数据画布生成类似于以下内容的 SQL 查询:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
您还可以通过手动修改 SQL 查询或更改自然语言提示并重新生成查询来修改查询。在本示例中,我们将修改自然语言提示,以仅选择客户使用现金付款的行程。
提示 3:通过更改提示来修改查询
Get me the 100 longest trips where the payment type is cash
可能的结果
BigQuery 数据画布生成类似于以下内容的 SQL 查询:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `daui-storage.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
点击运行以查看查询结果。
提示 4:创建图表
- 点击可视化
- 点击创建条形图。
可能的结果
BigQuery 数据画布会创建一个条形图,按行程 ID 显示最长行程里程数。
BigQuery 数据画布除了提供图表之外,还汇总了支持可视化的数据的一些关键详细信息。若要修改图表,您可以点击可视化详情并在侧边栏中修改图表。
若要共享 BigQuery 数据画布,请点击共享,然后点击共享链接以复制 BigQuery 数据画布链接。
若要清理 BigQuery 数据画布,请点击清除画布。这样,你将得到空白画布。
示例 2:处理多个表
提示 1:
Information about trees
可能的结果:
BigQuery 数据画布会推荐几个包含树相关信息的表。在此示例中,我们将使用两个表:bigquery-public-data.new_york_trees.tree_census_1995
和 bigquery-public-data.new_york_trees.tree_census_2015
。
选择这两个表后,它们会显示在画布上。
在此示例中,点击 bigquery-public-data.new_york_trees.tree_census_1995
表上的联接以联接两个表。BigQuery 数据画布会建议要联接的表。选中 bigquery-public-data.new_york_trees.tree_census_2015
。此时会显示一个新窗格,其中包含与每个表的连接。
提示 2:
Join these tables on their address
可能的结果
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
BigQuery 数据画布建议 SQL 查询在地址上联接这两个表。点击运行以运行查询并查看结果。
借助 BigQuery 数据画布,您可以将查询导出为笔记本。若要导出到笔记本,请执行以下操作:
- 点击导出为笔记本标签页。
- 在“保存笔记本”窗格中,输入保存笔记本时为其使用的名称和区域。
- 点击保存。笔记本已成功创建。
- 点击在 BQ Studio 中打开以查看创建的笔记本。
示例 3
提示 1
Find data about USA names
可能的结果
BigQuery 数据画布会生成表列表。在此示例中,我们将选择 bigquery-public-data.usa_names.usa_1910_current
表。
点击查询以查询数据。输入提示以查询数据。
可能的结果
BigQuery 数据画布生成以下查询:
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
BigQuery 数据画布会生成查询结果。我们将要求使用另一个查询来过滤此数据。点击查询这些结果。
提示 2
Get me the top 10 most popular names in 1980
可能的结果
BigQuery 数据画布生成以下查询:
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
运行查询后,我们会得到一个表,其中包含 1980 年新生儿使用最多的 10 个名字。
在此示例中,我们将直观呈现这些结果。点击可视化。BigQuery 数据画布会推荐几个可视化选项,包括条形图、饼图、折线图和自定义可视化。点击创建条形图。
BigQuery 数据画布会创建一个类似如下的条形图:
BigQuery 数据画布除了提供图表之外,还汇总了支持可视化的数据的一些关键详细信息。若要修改图表,您可以点击可视化详情并在侧边栏中修改图表。
提示 3
Create a bar chart sorted high to low, with a gradient
可能的结果
BigQuery 数据画布会创建一个类似如下的条形图:
如需进行其他更改,请点击可视化详情。此时会显示 Vis 详细信息边栏。您可以修改图表标题、x 轴名称、y 轴名称等。此外,如果点击 JSON 标签页,您可以根据 JSON 值直接修改图表。
价格
使用 BigQuery 数据画布时,您需要根据基于计算或存储的价格模式付费。在预览版期间,将 Gemini 与 BigQuery 数据画布搭配使用不会产生额外费用。
提供反馈
您可以通过向 Google 提交反馈,帮助改进 BigQuery 数据画布建议。若要提供反馈,请按以下步骤操作:
在 Google Cloud 控制台的工具栏中,点击提交反馈。
可选:点击
复制以复制 DAG JSON 信息,为您的反馈提供更多上下文。点击表单并填写表单,以提供反馈。
数据共享设置适用于整个项目,且只能由拥有 serviceusage.services.enable
和 serviceusage.services.list
IAM 权限的项目管理员设定。如需详细了解可信测试员计划中的数据使用方式,请参阅 Google Cloud 中的 Gemini 可信测试员计划。
您还可以联系 datacanvas-feedback@google.com 以直接提供有关此功能的反馈。
后续步骤
了解如何在 Gemini 的协助下编写查询。
了解如何创建笔记本。