快速入门:使用 GCP Console 中的网页界面

Cloud Console 中的 BigQuery 网页界面是一个直观的界面,可用于完成运行查询、加载数据和导出数据等任务。本快速入门向您介绍了如何查询公共数据集中的表,以及如何使用 Cloud Console 将示例数据加载到 BigQuery 中。

准备工作

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. 在 GCP Console 的项目选择器页面上,选择或创建 GCP 项目。

    转到项目选择器页面

  3. 新项目会自动启用 BigQuery。 如需在现有项目中激活 BigQuery,请转到 启用BigQueryAPI。

    启用 API

  4. 如果您不想在项目中使用信用卡或启用结算功能,BigQuery 提供了沙盒机制。无论您的项目是否启用了结算功能,本主题中的步骤都适用。如果您想启用结算功能,请参阅了解如何启用结算功能

查询公共数据集

通过 BigQuery 网页界面,您可以查询表(包括由 BigQuery 提供的公共数据集)。

在此示例中,您将查询美国姓名数据公共数据集,以确定 1910 年至 2013 年间美国人最常用的姓名。

默认情况下,BigQuery 公开数据集会显示在 Cloud Console 中。如需手动打开公共数据集项目,请在浏览器中输入以下网址:

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

如需查询公共数据集中的数据,请执行以下操作:

  1. 转到 Cloud Console 中的 BigQuery 网页界面。

    转到 BigQuery 网页界面

  2. 点击窗口右上角的编写新查询。如果此文本呈灰显状态,则表示查询编辑器已经打开。

    编写查询按钮

  3. 将以下查询复制并粘贴到查询文本区域中。

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 点击窗口右下角的绿色对勾标记,以查看查询验证器。

    查询验证器

    如果查询有效,则会显示一个绿色对勾标记图标。如果查询无效,则会显示一个红色感叹号图标。如果查询有效,在您运行查询后,验证程序还会显示查询要处理的数据量。处理的数据量有助于确定运行查询的费用。

  5. 点击运行。查询结果页面显示在查询窗口下方。查询结果页面顶部会显示所用的时间和查询处理的数据。在 Query complete... 消息下方,您会看到一个显示查询结果的表,其中的标题行包含了您在查询中选择的每个列的名称。

    BigQuery 网页界面查询结果

将数据加载到表中

接下来,您要将数据加载到表中并查询该表。

下载数据

您要下载的文件由美国社会保障管理局提供,其中包含了约 7 MB 的热门婴儿姓名数据。

  1. 下载婴儿姓名 ZIP 文件

  2. 将该文件解压缩到您的机器上。

    该 ZIP 文件中包含一个描述数据集的 NationalReadMe.pdf 文件。 详细了解该数据集

  3. 打开名为 yob2014.txt 的文件,查看其具体内容。该文件是一个英文逗号分隔值 (CSV) 文件,其中包含以下三列:姓名、性别(MF)和取该姓名的儿童人数。该文件没有标题行。

  4. 请记下 yob2014.txt 文件的位置,以便于日后查找。

创建数据集

接下来,在网页界面中创建数据集以用于存储数据。

  1. 如有必要,请打开 BigQuery 网页界面。

    转到 BigQuery 网页界面

  2. 在导航面板的资源部分,点击您的项目名称。

  3. 在右侧的详细信息面板中,点击创建数据集

    BigQuery 网页界面查询结果

  4. 创建数据集页面中执行以下操作:

    • 数据集 ID 部分,输入 babynames
    • 数据位置部分,选择美国 (US)。目前,公共数据集存储在 US 多区域位置。 为简单起见,您应将数据集放在同一位置。

      创建数据集页面

  5. 保留其他所有默认设置不变,然后点击创建数据集

将数据加载到新表中

接下来,将数据加载到新表中。

  1. 在导航面板的资源部分中,点击您刚刚创建的 babynames 数据集。

  2. 在右侧的详细信息面板中,点击创建表

    除非另有说明,否则所有设置均使用默认值。

  3. 创建表页面中执行以下操作:

    • 来源部分,点击空表并选择上传。
    • 选择文件部分,点击浏览,导航到 yob2014.txt 文件,然后点击打开。
    • 文件格式部分,点击 Avro 并选择 CSV。
    • 目标位置部分的表名称中,输入 names_2014
    • 架构部分,点击以文本形式修改切换开关,并将以下架构定义粘贴到相应的框中。

        name:string,gender:string,count:integer
        

      新建表页面

  4. 点击创建表

  5. 等待 BigQuery 创建表和加载数据。 在 BigQuery 加载数据期间,导航面板中的相应作业记录旁会显示 (1 running) 字符串。数据加载完毕之后,该字符串即会消失。

预览表

(1 个作业正在运行)(1 running) 字符串消失后,您便可以访问该表。如需预览前几行数据,请执行以下操作:

  1. 在导航面板中依次选择 babynames > names_2014

  2. 在详细信息面板中,点击预览标签页。

    BigQuery 网页界面表预览

查询表

现在,您已将数据加载到表中,接下来可以对该表进行查询了。 此过程与前一个示例相同,只是这一次您查询的是自己的表,而非公共数据集中的表。

  1. 如果需要,请点击编写新查询按钮。除非您之前隐藏了查询窗口,否则它应该仍然可见。

  2. 将以下查询复制并粘贴到查询文本区域中。此查询检索 2014 年美国最热门的 5 个男婴名字。

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 点击运行。查询结果会显示在查询窗口下方。

    姓名查询结果

清理

为避免系统因本快速入门中使用的资源向您的 Google Cloud 帐号收取费用,请按照以下步骤操作。

  1. 如有必要,请打开 BigQuery 网页界面。

    转到 BigQuery 网页界面

  2. 在导航面板的资源部分中,点击您创建的 babynames 数据集。

  3. 在右侧的详细信息面板中,点击删除数据集。此操作会删除相关数据集、表和所有数据。

  4. 删除数据集对话框中,输入您的数据集的名称 (babynames),然后点击删除以确认删除命令。

后续步骤