使用 BigQuery 网页界面

BigQuery 提供了一个图形网页界面,可用于创建和管理 BigQuery 资源以及运行 SQL 查询。本页面简要介绍了 BigQuery 网页界面的用法。

如需此网页界面使用方面的简介,请参阅:BigQuery 网页界面快速入门

准备工作

要使用 BigQuery 浏览器工具,您的帐号必须有权访问 Cloud Console 中已启用 BigQuery 的项目。默认情况下,系统会为您创建的新项目启用 BigQuery。如果您打算处理的数据量超出 Google Cloud Platform 免费层级的用量限制,您还必须为项目启用结算功能

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. Select or create a Google Cloud Platform project.

    Go to the Manage resources page

  3. 确保您的项目已启用结算功能。

    了解如何启用结算功能

  4. 系统会自动在新项目中启用 BigQuery。 要在现有的项目中激活 BigQuery,请 启用BigQuery API。

    启用 API

打开网页界面

要打开网页界面,请在浏览器中输入以下网址,并将 project_id 替换为您要在网页界面中打开的项目的 ID:

https://bigquery.cloud.google.com/project_id

点击下面的按钮将使用您最近访问的项目打开该网页界面。

转至网页界面

网页界面概览

该网页界面有三个主要部分:

  1. 页面左侧(导航窗格):
    导航窗格的上半部分包含描述您要执行的操作(编写查询、查看查询记录或查看作业记录)的项目列表。
    导航窗格的下半部分包含当前项目中您有权访问的数据集列表,以及 BigQuery 公共数据集。系统提供了一个过滤条件框,可让您按数据集 ID 或标签过滤数据。
  2. 详细信息窗格:
    包含适合导航窗格中所选操作的信息。例如,如果您点击导航窗格中的某个数据集,则详细信息窗格会显示该数据集的相关信息。
  3. 查询窗口:
    点击编写查询时,系统会在详细信息窗格上方添加一个新查询窗口。如果您不再需要此窗口,可以将其关闭。

BigQuery 网页界面屏幕截图

显示资源

导航窗格列出了您可以在当前项目中浏览的数据集。点击任意数据集旁边的 展开数据集图标 图标或点击该数据集的名称可展开该数据集并显示该数据集中的表。

点击某个表后,详细信息窗格中即会显示该表的相关信息。然后,您可以点击该窗格右侧的查询表按钮,以在查询框中填充该表的基本查询。您可以手动修改查询以指定字段,也可以根据需求自定义查询。您并非只能查询当前选定的表。如需详细了解如何查询表,请参阅运行交互式查询

添加和移除项目

您的所有 BigQuery 工作都在一个项目中完成。您可以在导航窗格中的数据集列表下方看到此项目的名称。系统会向附加到项目的结算帐号收取该项目中所有工作的费用。如需详细了解 BigQuery 费用,请参阅价格页面。

在网页界面中,您可以执行以下操作:

  • 添加其他项目(或将其他项目置顶)
  • 移除已置顶的项目
  • 切换到其他项目

添加项目

您可以在网页界面中使用项目下拉菜单添加项目或将项目“置顶”。将某个项目置于导航窗格顶部可让您浏览和查询另一个项目中的资源。如果您查询置顶项目中的资源,系统会向附加到该项目的结算帐号收取查询费用。但置顶项目不会产生费用。

要将某个项目添加到界面中,请按如下所述操作:

  1. 点击导航窗格中项目名称旁边的向下箭头图标 向下箭头图标

  2. 在下拉菜单中,依次点击切换到项目 > 显示项目 (Switch to project > Display project)。

  3. 显示项目 (Display Project) 对话框中:

    • 输入项目 ID。
    • 将项目显示在导航窗格中 (Display project in navigation panel) 保持选中状态。
    • 点击确定 (OK),将该项目添加到导航面板中。

    “显示项目”对话框

从界面中移除项目

要移除之前添加(或“置顶”)的项目,请按如下所述操作:

  1. 点击导航窗格中项目名称旁边的向下箭头图标 向下箭头图标

  2. 在下拉菜单中,点击从面板中移除项目 (Remove project from panel)。

切换项目

如果您希望切换到另一个项目(而不是在界面中将其置顶),则可以使用上下文菜单。

要切换项目,请如下所述操作:

  1. 点击导航窗格中项目名称旁边的向下箭头图标 向下箭头图标

  2. 在下拉菜单中,点击切换到项目 (Switch to project),然后从列表中选择项目。此操作会将界面中先前的项目替换为您所选的项目。

添加共享数据集

其他用户可以在不向您授予对相应项目的访问权限的情况下与您共享数据集。如果发生这种情况,您应该会收到一封电子邮件,其中显示包含共享数据集的项目的名称。项目和数据集不会自动显示在界面中。

如果您点击电子邮件中的 browser tool 链接,系统即会打开网页界面并显示相应的项目。如果您希望将包含共享数据集的项目置顶,请按照添加项目中的步骤操作。

查看作业和查询记录

当您使用网页界面运行作业运行查询时,系统会将您的记录保留在导航窗格中。查询也是一种作业,但为了便于使用,系统会单独保留您的查询记录。

界面中的作业和查询记录包括您在过去 6 个月内提交的所有加载、导出、复制和查询作业(最多 1000 个条目)。作业数限制(1000 个)是所有作业类型的累计限制。

查看作业记录

要查看作业记录,您可以执行以下操作之一:

  • 点击导航窗格中的作业记录链接。

  • 在浏览器中输入以下网址:

    https://bigquery.cloud.google.com/jobs/project_id

您可以使用网页界面重复运行加载作业,但不能重复运行导出或复制作业。

查看查询记录

要查看查询记录,您可以执行以下操作之一:

  • 点击导航窗格中的查询记录链接。

  • 在浏览器中输入以下网址:

    https://bigquery.cloud.google.com/queries/project_id

您可以使用网页界面重复运行查询作业

搜索作业和查询记录

您可以过滤(或搜索)查询记录或作业记录,使系统仅显示符合条件的特定作业。返回的结果仅限于界面检索的作业池。默认情况下,您可以通过界面搜索 1000 个最近的作业。

要列出记录中的所有可用作业,请使用 jobs.list API 方法或 bq ls CLI 命令。

要过滤您的查询或作业记录,请执行以下操作:

  1. 在导航窗格中,点击作业记录查询记录
  2. 点击“过滤作业”下拉列表以打开过滤条件表达式框。
  3. 在过滤条件表达式框中执行以下操作:

    • 点击任意可选择过滤条件。
    • 点击运算符下拉列表并选择一个运算符。系统会根据您所选的条件显示不同的运算符列表。例如,如果您选择文本条件,则运算符列表会包含子字符串正则表达式
    • 在框中输入一个值。

      过滤条件表达式开发工具

  4. 点击可添加其他可选的过滤条件。

  5. 点击搜索

您可以使用以下任何作业属性过滤查询作业:

  • 任意 - 任何属性。
  • 作业 ID (jobid) - 作业的唯一不透明 ID。
  • 用户 (user) - 提交作业的用户。
  • 开始时间 (start) - 作业的开始时间(以毫秒为单位,从 Epoch 起算)。当作业从 PENDING 状态转换为 RUNNINGDONE 时,系统会显示此属性。
  • 结束时间 (end) - 作业的结束时间(以毫秒为单位,从 Epoch 起算)。只要作业处于 DONE 状态,系统就会显示此属性。
  • 目标表 (dest) - 作业操作(加载、复制或查询)的目标表名称。
  • 查询文本 - 提交的 SQL 查询文本。
  • 处理的字节数 - SQL 查询处理的字节总数。
  • UDF 代码 - 包含用户指定函数 (UDF) 代码的内嵌资源。

您可以使用以下任一作业属性过滤加载、复制和提取作业:

  • 任意 - 任何属性。
  • 作业 ID (jobid) - 作业的唯一不透明 ID。
  • 用户 (user) - 提交作业的用户。
  • 开始时间 (start) - 作业的开始时间(以毫秒为单位,从 Epoch 起算)。当作业从 PENDING 状态转换为 RUNNINGDONE 时,系统会显示此属性。
  • 结束时间 (end) - 作业的结束时间(以毫秒为单位,从 Epoch 起算)。只要作业处于 DONE 状态,系统就会显示此属性。
  • 目标表 (dest) - 作业操作(加载、复制或查询)的目标表名称。
  • 标题 (title) - 记录中显示的标题,例如,加载作业的标题可能是“uploaded file to myproject:mydataset.mytable”。
  • 类型 (type) - 作业类型:加载、查询、复制或提取(导出)。
  • 复制作业的来源表格 (copysrc) - 复制作业中的源表。
  • 目标 URI (desturi) - 提取(导出)作业对应的 Cloud Storage 目标 URI。
  • 源表 (srctable) - 提取作业中的源表。
  • 源 URI (srcuri) - 加载作业对应的 Cloud Storage 来源 URI。

对查询记录排序

您还可以使用查询窗格中的排序方式选项,在界面中对查询记录进行排序。当您点击导航窗格中的查询记录时,系统即会打开查询窗格。

查询记录的“排序方式”按钮

排序选项包括:

  • 日期 - 按运行日期对查询排序。
  • 时长 - 按总运行时间对查询排序。
  • 时长/字节 (Duration/byte) - 按时长对查询排序(根据输入字节数规范化)。这样,您就可以将查询的运行时间与不同的输入大小进行比较。例如,您可能有一组随时间增大的表,并希望比较查询的效率,同时忽略仅由输入大小变化而造成的差异。这会假设输入大小和运行时之间的关系是线性的。
  • 输入字节数 (Input bytes) - 按读取的字节数对查询排序。
  • 槽(毫秒)(Slot-ms) - 按查询使用的所有槽中处于活动状态的毫秒数总和对查询排序。按“槽(毫秒)”排序是一种衡量处理工作量的更稳定方式,因为它受系统延迟和其他不确定因素的影响较小,这些不确定因素会影响观测到的时长。
  • 槽(毫秒)/字节 (Slot-ms/byte) - 与“时长/字节”(Duration/byte) 类似,“槽(毫秒)/字节”(Slot-ms/byte) 是“槽(毫秒)”(slot-ms) 的规范化表示形式。

    查询记录排序选项

网页界面显示限制

网页界面具有以下显示限制:

  • 导航窗格中最多可显示 1 万个项目。
  • 对于每个项目,导航窗格中最多可显示 1000 个数据集。
  • 对于每个数据集,导航窗格中最多显示 3 万个表。您可以显示所有数据集(包括置顶项目中的数据集)中的表(总共累计 75000 个)。

控制网页界面显示性能

在极少数情况下,当某个项目有许多数据集包含大量表时,可能会影响网页界面的性能。要在项目包含大量资源时提高界面性能,请使用 ?minimal 参数将每个项目显示的资源数量限制为 10000 个表。例如,在浏览器中输入以下网址以限制显示的资源数量:

https://bigquery.cloud.google.com/queries/project_id?minimal

键盘快捷键

网页界面支持以下键盘快捷键:

组合键 (Windows/Linux) 组合键(Mac 操作系统) 操作
Ctrl + 空格键 Ctrl + 空格键 如果没有打开查询:编写新查询
如果查询编辑器已打开:自动填充当前字词
Ctrl + Enter Cmd + Enter 运行当前查询
Tab Tab 自动填充当前字词
Ctrl Cmd 突出显示表名称
Ctrl + 点击表名称 Cmd + 点击表名称 打开表架构
Ctrl + E Cmd + E 基于所选内容运行查询
Ctrl + / Cmd + / 注释当前行或选定行
Ctrl + Shift + F Cmd + Shift + F 设置查询格式

示例

如需网页界面示例,请参阅 BigQuery 文档中的方法指南部分。下文提供了指向常见网页界面任务(如运行查询;创建、获取、列出、删除和修改 BigQuery 资源)的链接。

查询数据

如需了解如何使用网页界面创建和运行查询,请参阅以下内容:

创建资源

如需了解如何使用网页界面创建资源,请参阅以下内容:

获取资源相关信息

如需了解如何使用网页界面获取资源相关信息,请参阅以下内容:

列出资源

如需了解如何使用网页界面列出资源,请参阅以下内容:

更新资源

如需了解如何使用网页界面更新资源,请参阅以下内容:

加载数据

如需了解如何使用网页界面加载数据,请参阅以下内容:

使用外部数据源

如需了解如何使用网页界面查询外部数据源中的数据,请参阅以下内容:

导出数据

如需了解如何使用网页界面导出数据,请参阅以下内容:

使用 BigQuery Data Transfer Service

如需了解如何搭配 BigQuery Data Transfer Service 使用网页界面,请参阅以下内容:

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
需要帮助?请访问我们的支持页面