快速入门:使用 Cloud Console

本页面介绍如何使用 Google Cloud Console 查询公共数据集中的表,并将示例数据加载到 BigQuery 表中。

准备工作

  1. 登录您的 Google Cloud 帐号。如果您是 Google Cloud 新手,请创建一个帐号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  3. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  4. 新项目会自动启用 BigQuery。如需在预先存在的项目中激活 BigQuery,请转到 启用 BigQuery API。

    启用 API

  5. 可选:为项目启用结算功能。如果您不想启用结算功能或提供信用卡,本文档中的步骤仍然有效。BigQuery 提供执行这些步骤的沙盒

查询公共数据集

您可以使用 Cloud Console 查询表,包括 BigQuery 公共数据集

在此示例中,您将查询美国姓名数据公共数据集,以确定 1910 年至 2013 年间美国人最常用的姓名。

https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project

如需查询公共数据集,请按照下列步骤操作:

  1. 在 Cloud Console 中,转到 BigQuery 页面。

    转到 BigQuery

  2. 如果未显示编辑器标签页,则点击编写新查询

    “编辑器”标签页。

  3. 编辑器字段中,粘贴以下内容:

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    

    如果查询有效,则会显示一个对勾标记以及查询将处理的数据量。如果查询无效,则会显示一个感叹号,并会显示错误消息。

    查询验证器。

  4. 点击运行查询结果部分显示所用的时间以及查询处理的数据量。

  5. 如要查看详细的查询结果,请点击结果标签页。该表的标题行包含您在查询中选择的每个列名称。

    Cloud Console 中的查询结果。

创建和查询数据集

接下来,创建一个数据集,将数据加载到表中,然后查询该数据集。

创建数据集

使用 Cloud Console 创建用于存储数据的数据集。

  1. 在 Cloud Console 中,打开 BigQuery 页面。

    转到 BigQuery

  2. 浏览器面板中,点击您的项目名称。

  3. 展开 查看操作选项,然后点击创建数据集

  4. 创建数据集 页面上,执行以下操作:

    • 数据集 ID 部分,输入 babynames
    • 数据位置下拉列表中,选择美国 (US)。目前,公共数据集存储在 US 多区域位置。简单起见,请将数据集存储在同一位置。

      创建数据集页面。

  5. 保持其余默认设置不变,然后点击创建数据集

下载数据

您要下载的文件包含约 7 MB 的热门婴儿名字数据。由美国社会保障管理局提供。

如需详细了解数据集,请参阅社会保障管理局的数据集信息页面

  1. 下载婴儿姓名 ZIP 文件

  2. 提取文件。

    如需详细了解数据集架构,请参阅 ZIP 文件的 NationalReadMe.pdf 文件。

  3. 如要查看数据,请打开 yob2014.txt 文件。此文件包含名称、性别(MF)和具有该名称的儿童人数的逗号分隔值。该文件没有标题行。

  4. 请记下 yob2014.txt 文件的位置,以便于日后查找。

将数据加载到表中

接下来,将数据加载到新表中。

  1. 浏览器面板中,点击您创建的 babynames 数据集。

  2. 展开 查看操作选项,然后点击打开

  3. 在详细信息面板中,点击创建表

    除非另有说明,否则请使用所有设置的默认值。

  4. 创建表格 页面上,执行以下操作:

    • 来源部分,为基于以下数据创建表选择上传
    • 选择文件部分,点击浏览,导航到 yob2014.txt 文件,然后点击打开
    • 文件格式下拉列表中,选择 CSV
    • 目标位置部分的表名称字段中,输入 names_2014
    • 架构部分,点击以文本形式修改切换开关,并将以下架构定义粘贴到文本字段。

        name:string,gender:string,count:integer
        

  5. 点击创建表

    等待 BigQuery 创建表和加载数据。 BigQuery 完成数据加载后,作业历史记录面板中会显示一个对勾标记。

预览表数据

如需预览该表数据,请按照以下步骤操作:

  1. 浏览器面板中,展开 babynames 并选择 names_2014

  2. 在详细信息面板中,点击预览。BigQuery 会显示表的前几行。

    Cloud Console 表预览。

查询表数据

接下来,查询该表。此过程与前一个示例相同,不同的是,这一次您查询的是自己的表,而非公共数据集中的表。

  1. 点击编写新查询。随即会打开一个新的编辑器标签页。

  2. 编辑器字段中,粘贴以下查询。此查询检索 2014 年美国最热门的 5 个男婴名字。

    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. 点击运行。结果会显示在查询结果部分中。

    姓名查询结果。

清理

为避免系统因本页中使用的资源向您的 Google Cloud 帐号收取费用,请按照以下步骤操作。

  1. 在 Cloud Console 中,打开 BigQuery 页面。

    转到 BigQuery

  2. 浏览器面板中,点击您创建的 babynames 数据集。

  3. 展开 查看操作选项,然后点击删除

  4. 删除数据集对话框中,确认删除命令:输入数据集的名称 (babynames),然后点击删除

后续步骤