使用 Google Cloud 控制台查询公共数据集

了解如何使用 Google Cloud 控制台在 BigQuery 中查找和查询公共数据集。


如需在 Google Cloud 控制台中直接遵循有关此任务的分步指导,请点击操作演示

操作演示


须知事项

  1. 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  3. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  4. 确保您的 Google Cloud 项目已启用结算功能

  5. 如果您没有为本教程中使用的 Google Cloud 项目启用结算功能,则需要在 BigQuery 沙盒中上传和处理数据。借助 BigQuery 沙盒,您可以免费使用限定的 BigQuery 功能,了解 BigQuery。

  6. 确保已启用 BigQuery API。

    启用 API

    如果您创建了一个新项目,则系统会自动启用 BigQuery API。

打开公共数据集

默认情况下,BigQuery 公共数据集可以通过 Google Cloud 控制台使用。

在以下示例中,您可以访问公共项目 bigquery-public-data 中的数据集。

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 探索器窗格中,点击 +添加

  3. 添加对话框中,搜索 public datasets,然后点击 公共数据集图标。 公共数据集

  4. 选择一个数据集,然后点击查看数据集

    探索器窗格中,您的数据集处于选中状态,您可以查看其详细信息。

  5. 可选:点击数据集旁边的 查看操作可查看更多选项。

    每个数据集都包含一些表,您可以通过点击任何数据集旁边的 切换节点来查看这些表。

查询公共数据集

在以下步骤中,您将查询“USA Names”(美国人名)公共数据集,以确定 1910 年至 2013 年期间美国最常用的名字:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 转到编辑器字段。

    如果编辑器字段不可见,请点击 编写新查询“编辑器”标签页。

  3. 编辑器字段中,复制以下查询:

    SELECT
      name,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name
    ORDER BY
      total DESC
    LIMIT
      10;
    

    如果查询有效,则会显示一个对勾标记以及查询处理的数据量。如果查询无效,则会显示一个感叹号,并会显示错误消息。

    查询验证器。

  4. 点击运行

    查询结果部分列出了最常见的名字。该表的标题行包含您在查询中选择的每个列名称。

    Google Cloud 控制台中的查询结果。

  5. 可选:如需显示查询处理的时长和数据量,请点击查询结果部分中的作业信息

清理

为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。

删除项目

如果您使用 BigQuery 沙盒查询公共数据集,则您的项目不会启用结算功能。

为了避免产生费用,最简单的方法是删除您为本教程创建的项目。

如需删除项目,请执行以下操作:

  1. 在 Google Cloud 控制台中,进入管理资源页面。

    转到“管理资源”

  2. 在项目列表中,选择要删除的项目,然后点击删除
  3. 在对话框中输入项目 ID,然后点击关闭以删除项目。

后续步骤