快速入门:使用 Cloud Console

您可以将 Google Cloud Console 用作可视界面来完成诸如运行查询,加载数据和导出数据之类的任务。本快速入门向您介绍了如何查询公共数据集中的表,以及如何使用 Cloud Console 将示例数据加载到 BigQuery 中。

准备工作

  1. 登录您的 Google Cloud 帐号。如果您是 Google Cloud 新手,请创建一个帐号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  3. 新项目会自动启用 BigQuery。如需在预先存在的项目中激活 BigQuery,请转到 启用 BigQuery API。

    启用 API

  4. 如果您不想提供信用卡或为项目启用结算功能,BigQuery 会提供沙盒。无论您的项目是否启用了结算功能,本主题中的步骤都适用。如果您想启用结算功能,请参阅了解如何启用结算功能

查询公共数据集

Cloud Console 提供了用于查询表(包括由 BigQuery 提供的公共数据集)的界面。

在此示例中,您将查询美国姓名数据公共数据集,以确定 1910 年至 2013 年间美国人最常用的姓名。

默认情况下,BigQuery 公开数据集会显示在 Cloud Console 中。如需手动打开公共数据集项目,请在浏览器中输入以下网址:

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

如需查询公共数据集中的数据,请按照以下步骤操作:

  1. 转到 Cloud Console 中的 BigQuery 页面。

    转到 BigQuery 页面

  2. 如果未显示编辑器标签页,请点击编写新查询

    “编辑器”标签页。

  3. 将以下查询复制并粘贴到编辑器字段中。

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    
  4. 如果查询有效,则会显示一个对勾标记以及查询将处理的数据量。此指标有助于您确定运行查询的费用。如果查询无效,则会显示一个感叹号,并会显示错误消息。

    查询验证器。

  5. 点击运行。查询结果页面显示在查询窗口下方。查询结果页面顶部会显示所用的时间和查询处理的数据。在 Query complete... 消息下方,您会看到一个显示查询结果的表,其中的标题行包含了您在查询中选择的每个列的名称。

    Cloud Console 中的查询结果。

将数据加载到表中

接下来,要将数据加载到表中并查询该表。

下载数据

您下载的文件包含约 7 MB 的关于热门婴儿名字的数据(由美国社会保障管理局提供)。

  1. 下载婴儿姓名 ZIP 文件

  2. 将该文件解压缩到您的计算机上。

    该 ZIP 文件中包含一个描述数据集的 NationalReadMe.pdf 文件。 详细了解该数据集

  3. 打开名为 yob2014.txt 的文件,查看其具体内容。该文件是一个英文逗号分隔值 (CSV) 文件,其中包含以下三列:姓名、性别(MF)和取该姓名的儿童人数。该文件没有标题行。

  4. 请记下 yob2014.txt 文件的位置,以便于日后查找。

创建数据集

接下来,在 Cloud Console 中创建数据集来存储数据。

  1. 如有必要,请在 Cloud Console 中打开 BigQuery 页面。

    转到 BigQuery 页面

  2. 浏览器面板中,点击您的项目名称。

  3. 在详情面板中,点击创建数据集

  4. 创建数据集 页面上,执行以下操作:

    • 数据集 ID 部分,输入 babynames
    • 选择美国 (US) 作为数据位置。目前,公共数据集存储在 US 多地区位置。 为简单起见,请将数据集放在同一位置。

      创建数据集页面。

  5. 保留所有其他默认设置不变,然后点击创建数据集

将数据加载到新表中

接下来,将数据加载到新表中。

  1. 浏览器面板中,点击您创建的 babynames 数据集。

  2. 在详情面板中,点击创建表

    除非另有说明,否则所有设置均使用默认值。

  3. 创建表格 页面上,执行以下操作:

    • 来源部分,为基于以下数据创建表选择上传
    • 选择文件 部分,点击 浏览,导航到 yob2014.txt 文件,然后点击 打开
    • 对于文件格式,选择 CSV
    • 目标位置部分的表名称中,输入 names_2014
    • 架构 部分,点击 以文字形式修改 开关,并将以下架构定义粘贴到相应的框中。

        name:string,gender:string,count:integer
        

      新建表页面。

  4. 点击创建表

  5. 等待 BigQuery 创建表和加载数据。 BigQuery 完成数据加载后,作业历史记录面板中会显示一个对勾标记。

预览表

如需预览前几行数据,请按照以下步骤操作:

  1. 浏览器面板中,展开 babynames 并选择 names_2014

  2. 在详细信息面板中,点击预览。BigQuery 会显示表的前几行。

    Cloud Console 表预览。

查询表

现在,您已将数据加载到表中,接下来可以对该表进行查询了。 此过程与前一个示例相同,只是这一次您查询的是自己的表,而非公共数据集中的表。

  1. 点击编写新查询 。此时会打开一个新的查询编辑器标签页。

  2. 将以下查询复制并粘贴到查询文本区域中。此查询检索 2014 年美国最热门的 5 个男婴名字。

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 点击运行。查询结果会显示在查询窗口下方。

    姓名查询结果。

清理

为避免系统因本快速入门中使用的资源向您的 Google Cloud 帐号收取费用,请按照以下步骤操作。

  1. 如有必要,请在 Cloud Console 中打开 BigQuery 页面。

    转到 BigQuery 页面

  2. 浏览器面板中,点击您创建的 babynames 数据集。

  3. 在详情面板中,点击删除数据集。此操作会删除相关数据集、表和所有数据。

  4. 删除数据集对话框中,输入数据集的名称 (babynames),然后点击删除以确认执行删除命令。

后续步骤