快速入门:使用 GCP Console 中的网页界面

您可以将 GCP Console 中的 BigQuery 网页界面用作直观的界面,以完成运行查询、加载数据和导出数据等任务。本快速入门为您介绍如何查询公共数据集中的表以及如何使用 GCP Console 将示例数据加载到 BigQuery 中。

准备工作

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. 选择或创建 Google Cloud Platform 项目。

    转到“管理资源”页面

  3. 新项目中会自动启用 BigQuery。如需在现有项目中启用 BigQuery,请转到 启用BigQuery API。

    启用 API

  4. 如果您不想提供信用卡或为项目启用结算功能,BigQuery 会提供沙盒。无论项目是否启用了结算功能,本主题中的步骤都适用于项目。如果您想启用结算功能,请参阅了解如何启用结算功能

查询公共数据集

BigQuery 网页界面提供了用于查询表(包括由 BigQuery 提供的公共数据集)的界面。

在此示例中,您将查询美国名字数据公共数据集,以确定 1910 年至 2013 年间美国人最常用的名字。

默认情况下,GCP Console 中会显示 BigQuery 公共数据集。如需手动打开公共数据集项目,请在浏览器中输入以下网址:

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

如需查询公共数据集中的数据,请执行以下操作:

  1. 转到 GCP Console 中的 BigQuery 网页界面。

    转到 BigQuery 网页界面

  2. 点击窗口右上角的编写新查询。如果此文本呈灰显状态,则查询编辑器已经打开。

    “编写查询”按钮

  3. 将以下查询复制并粘贴到查询文本区域中。

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 点击窗口右下角的绿色对勾标记以查看查询验证程序。

    查询验证程序

    如果查询有效,会显示一个绿色对勾标记图标。如果查询无效,则会显示一个红色感叹号图标。如果查询有效,在您运行查询后,验证程序还会显示查询要处理的数据量。处理的数据量有助于确定运行查询的费用。

  5. 点击运行。查询结果页面显示在查询窗口下方。在查询结果页面的顶部,会显示所用的时间和查询处理的数据。Query complete... 消息下方的表格显示了查询结果,其标题行包含您在查询中所选的每个列的名称。

    BigQuery 网页界面查询结果

将数据加载到表中

接下来,您要将数据加载到表中并查询该表。

下载数据

您下载的文件包含约 7 MB 的关于热门婴儿名字的数据(由美国社会保障管理局提供)。

  1. 下载婴儿名字 ZIP 文件

  2. 将该文件解压缩到您的机器上。

    此 ZIP 文件包含描述数据集的 NationalReadMe.pdf 文件。 详细了解该数据集

  3. 打开名为 yob2014.txt 的文件来查看具体内容。该文件是一个逗号分隔值 (CSV) 文件,其中包含以下三列:名字、性别(MF)和取该名字的儿童人数。该文件没有标题行。

  4. 记下 yob2014.txt 文件的位置,便于稍后找到该文件。

创建数据集

接下来,在网页界面中创建数据集以存储数据。

  1. 如有必要,请打开 BigQuery 网页界面。

    转到 BigQuery 网页界面

  2. 在导航面板的资源部分,点击您的项目名称。

  3. 在右侧的详细信息面板中,点击创建数据集

    BigQuery 网页界面查询结果

  4. 创建数据集页面上执行以下操作:

    • 数据集 ID 部分,输入 babynames
    • 选择美国 (US) 作为数据位置。目前,公共数据集存储在 US 多区域位置。为简单起见,您应将数据集放在同一位置。

      “创建数据集”页面

  5. 保留所有其他默认设置不变,然后点击创建数据集

将数据加载到新表中

接下来,将数据加载到新表中。

  1. 在导航面板的资源部分中,点击您刚刚创建的 babynames 数据集。

  2. 在右侧的详细信息面板中,点击创建表

    除非另有说明,否则所有设置均使用默认值。

  3. 创建表页面上执行以下操作:

    • 部分,点击空表并选择上传
    • 选择文件部分,点击浏览,转到 yob2014.txt 文件,然后点击打开
    • 文件格式部分,点击 Avro 并选择 CSV
    • 目标部分的表名称中,输入 names_2014
    • 架构部分,点击以文字形式修改开关,并将以下架构定义粘贴到相应的框中。

        name:string,gender:string,count:integer
        

      新建表页面

  4. 点击创建表

  5. 等待 BigQuery 创建表和加载数据。当 BigQuery 加载数据时,导航面板中的作业历史记录旁会显示(1 个作业正在运行) (1 running) 字符串。数据加载完毕之后,该字符串将消失。

预览表

(1 个作业正在运行)(1 running) 字符串消失后,您便可以访问该表。如需预览前几行数据,请执行以下操作:

  1. 在导航面板中依次选择 babynames > names_2014

  2. 在详细信息面板中,点击预览标签。

    BigQuery 网页界面表预览

查询表

现在您已将数据加载到表中,可以进行查询了。此过程与前一个示例相同,只是此时您查询的是自己的表,而非公共数据集中的表。

  1. 如果需要,请点击编写新查询按钮。除非您之前隐藏了查询窗口,否则它应该仍然可见。

  2. 将以下查询复制并粘贴到查询文本区域中。此查询检索 2014 年美国最热门的 5 个男婴名字。

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 点击运行。查询结果会显示在查询窗口下方。

    名字查询结果

清理

为避免系统因本快速入门中使用的资源向您的 GCP 帐号收取费用,请执行以下操作:

  1. 如有必要,请打开 BigQuery 网页界面。

    转到 BigQuery 网页界面

  2. 在导航面板的资源部分中,点击您创建的 babynames 数据集。

  3. 在右侧的详细信息面板中,点击删除数据集。此操作会删除相关数据集、表和所有数据。

  4. 删除数据集对话框中,输入数据集的名称 (babynames),然后点击删除以确认该删除命令。

后续步骤

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
需要帮助?请访问我们的支持页面