使用 Google Cloud 控制台查询公共数据集
了解如何使用 Google Cloud 控制台在 BigQuery 中查找和查询公共数据集。
如需在 Google Cloud 控制台中直接遵循有关此任务的分步指导,请点击操作演示:
须知事项
- 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
确保已启用 BigQuery API。
如果您创建了一个新项目,则系统会自动启用 BigQuery API。
如果您没有为本教程中使用的 Google Cloud 项目启用结算功能,则需要在 BigQuery 沙盒中上传和处理数据。借助 BigQuery 沙盒,您可以免费使用限定的 BigQuery 功能,了解 BigQuery。
打开公共数据集
默认情况下,BigQuery 公共数据集可以通过 Google Cloud 控制台使用。
在以下示例中,您可以访问公共项目 bigquery-public-data
中的数据集。
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,点击
+添加 。在添加对话框中,搜索
public datasets
,然后点击 公共数据集。选择一个数据集,然后点击查看数据集。
在探索器窗格中,您的数据集处于选中状态,您可以查看其详细信息。
可选:点击数据集旁边的
查看操作可查看更多选项。每个数据集都包含一些表,您可以通过点击任何数据集旁边的
切换节点来查看这些表。
查询公共数据集
在以下步骤中,您将查询“USA Names”(美国人名)公共数据集,以确定 1910 年至 2013 年期间美国最常用的名字:
在 Google Cloud 控制台中,转到 BigQuery 页面。
转到
编辑器 字段。如果编辑器字段不可见,请点击
编写新查询。在
编辑器 字段中,复制以下查询:SELECT name, SUM(number) AS total FROM `bigquery-public-data.usa_names.usa_1910_2013` GROUP BY name ORDER BY total DESC LIMIT 10;
如果查询有效,则会显示一个对勾标记以及查询处理的数据量。如果查询无效,则会显示一个感叹号,并会显示错误消息。
点击
运行 。查询结果部分列出了最常见的名字。该表的标题行包含您在查询中选择的每个列名称。
可选:如需显示查询处理的时长和数据量,请点击
查询结果 部分中的作业信息。
清理
为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。
删除项目
如果您使用 BigQuery 沙盒查询公共数据集,则您的项目不会启用结算功能。
为了避免产生费用,最简单的方法是删除您为本教程创建的项目。
如需删除项目,请执行以下操作:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
后续步骤
- 了解 BigQuery 沙盒。
- 了解如何在 Google Cloud 控制台中创建数据集和查询表。
- 了解 BigQuery 动态。
- 了解 BigQuery 定价。
- 了解 BigQuery 配额和限制。