快速入门:使用经典版网页界面

经典版网页界面是一个直观的界面,可用于完成运行查询、加载数据和导出数据等任务。本快速入门将向您展示如何使用经典版网页界面查询公共表以及将示例数据加载到 BigQuery 中。

准备工作

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. 选择或创建 Google Cloud Platform 项目。

    转到“管理资源”页面

  3. 确保您的 Google Cloud Platform 项目已启用结算功能。

    了解如何启用结算功能

  4. 系统会自动为新项目启用 BigQuery。如需在现有项目中启用 BigQuery,请转到 启用BigQuery API。

    启用 API

查询公共数据集

经典版网页界面提供用于查询表(包括由 BigQuery 提供的公共数据集)的界面。

  1. 转到经典版网页界面。

    转到经典版网页界面

  2. 点击 Compose query 按钮。

  3. 将下述查询复制粘贴到 New Query 文本区域中:

    #standardSQL
    SELECT
      weight_pounds,
      state,
      year,
      gestation_weeks
    FROM
      `bigquery-public-data.samples.natality`
    ORDER BY
      weight_pounds DESC
    LIMIT
      10
    
  4. 点击圆形图标,以激活查询验证程序。

    BigQuery 网页界面查询验证程序

    按钮上方将显示绿色或红色部分,具体取决于查询是否有效。如果查询有效,则在您运行查询后,验证程序还将描述运要处理的数据量。此信息有助于确定运行查询的费用。

  5. 点击 Run query 按钮。查询结果显示在按钮下方。

    BigQuery 网页界面查询结果

以上查询访问 BigQuery 提供的公共数据集中的表。

要浏览其他公共数据集,您可以点击导航窗格中的 bigquery-public-data

将数据加载到表中

接下来,您要下载一些提供的数据,将数据加载到 BigQuery 表中,然后查询该数据。

提醒一下,必须启用结算功能才可运行快速入门的这一部分。如需了解详情,请参阅准备工作

下载数据

您下载的文件包含约 7 MB 的关于热门婴儿名字的数据(由美国社会保障管理局提供)。

  1. 下载婴儿名字 ZIP 文件

  2. 将该文件解压缩到您的机器上。

    该 ZIP 文件中包含一个描述数据集架构的自述文件。 详细了解该数据集

  3. 打开名为 yob2014.txt 的文件来查看具体内容。该文件是一个逗号分隔值 (CSV) 文件,其中包含以下三列:名字、性别(MF)和取该名字的儿童人数。该文件没有标题行。

  4. 记下 yob2014.txt 文件的位置,便于稍后找到该文件。

创建数据集

接下来,在经典版网页界面中创建数据集以存储数据。

  1. 转到经典版网页界面。

    转到经典版网页界面

  2. 在导航窗格中,点击项目名称旁边的向下箭头图标 向下箭头图标,然后点击 Create new dataset

  3. Create Dataset 对话框中执行以下操作:

    • Dataset ID 部分,输入 babynames
    • Data location 部分,选择 US。目前,公共数据集存储在 US 多区域位置。为简单起见,您应将数据集放在同一位置。
    • 对于 Data expiration,请保留默认值 Never。如果将数据到期时间设置为“never”,则在数据集中创建的表永远不会自动删除。您必须手动删除这些表。

      创建数据集

    • 点击 OK

    每个项目的数据集 ID 都是独一无二的,因此如果导航窗格中的项目名称下已列出 babynames,请向该名称附加一个数字,使其具有唯一性。点击问号图标可查看字段帮助。

将数据加载到新表中

接下来,将数据加载到新表中。

  1. 在导航窗格中,将鼠标悬停在您刚创建的 babynames 数据集上。

  2. 点击相应 ID 旁边的向下箭头图标 向下箭头图标图片,然后点击 Create new table

    babynames 向下箭头图标图片

    除非另有说明,否则对所有设置使用默认值。

  3. Source Data 中,点击 Choose file 按钮。导航到您之前解压缩的数据,然后选择 yob2014.txt 文件。

  4. 对于 Destination Table,为目标表名称输入以下值。

    names_2014
    
  5. Schema 部分下方,点击 Edit as Text

    “edit as text”链接

    然后将 Schema 输入区域的内容替换为以下架构定义:

    name:string,gender:string,count:integer
    
  6. 点击 Create Table 按钮。

  7. 等待 BigQuery 创建表和加载数据。当 BigQuery 加载数据时,导航窗格中的表名称后面将显示一个 (loading) 字符串。在数据加载完毕之后,该字符串将消失。

预览表

(loading) 字符串消失后,您便可以访问该表了。要预览前几行数据,请执行以下操作:

  1. 在导航窗格中选择 names_2014

  2. Table Details: names_2014 部分点击 Preview

    BigQuery 网页界面表预览

查询表

现在,您已将数据加载到表中,可以针对该表运行查询了。此过程与上面的查询公共数据集示例相同,只是此时您查询的是自己的表,而非公共数据集中的表。

  1. 点击 Compose query 按钮。

  2. 将以下查询复制粘贴到 New Query 文本区域中。

    #standardSQL
    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. (可选)在 Processing Location 中,点击 Unspecified 并选择 US。如果您的数据集位于 US 多区域位置,系统会自动检测处理位置。

  4. 点击 Run query 按钮。该查询会显示您加载到表中的数据所对应年份的最热门的 5 个男性名字。

清理

为避免系统因本快速入门中使用的资源向您的 GCP 帐号收取费用,请执行以下操作:

  1. 如有必要,请打开经典版网页界面。

    转到经典版网页界面

  2. 在导航中,将鼠标悬停在您创建的 babynames 数据集上。

  3. 在导航窗格中,点击数据集名称旁边的向下箭头图标 向下箭头图片,然后点击 Delete dataset。此操作会删除相关数据集、表和所有数据。

  4. Delete dataset 对话框中,输入数据集的名称 (babynames),然后点击 OK 以确认删除命令。

后续步骤

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
需要帮助?请访问我们的支持页面