快速入门:使用经典版网页界面

经典版网页界面是一个直观的界面,可用于完成运行查询、加载数据和导出数据等任务。本快速入门将向您展示如何使用经典版网页界面查询公共表以及将示例数据加载到 BigQuery 中。

准备工作

  1. 登录您的 Google 帐号。

    如果您还没有 Google 帐号,请注册新帐号

  2. 在 GCP Console 的项目选择器页面上,选择或创建 GCP 项目。

    转到项目选择器页面

  3. 新项目会自动启用 BigQuery。 如需在现有项目中激活 BigQuery,请转到 启用BigQueryAPI。

    启用 API

  4. 如果您不想在项目中使用信用卡或启用结算功能,BigQuery 提供了沙盒机制。无论您的项目是否启用了结算功能,本主题中的步骤都适用。如果您想启用结算功能,请参阅了解如何启用结算功能

查询公共数据集

通过经典版网页界面,您可以查询表(包括由 BigQuery 提供的公共数据集)。

  1. 转到经典版网页界面。

    转到经典版网页界面

  2. 点击 Compose query 按钮。

  3. 将下述查询复制粘贴到 New Query 文本区域中:

    #standardSQL
    SELECT
      weight_pounds,
      state,
      year,
      gestation_weeks
    FROM
      `bigquery-public-data.samples.natality`
    ORDER BY
      weight_pounds DESC
    LIMIT
      10
    
  4. 点击圆形图标,以激活查询验证器。

    BigQuery 网页界面查询验证器

    按钮上方将显示绿色或红色部分,具体取决于查询是否有效。如果查询有效,则在您运行查询后,验证程序还将描述运要处理的数据量。此信息有助于确定运行查询的费用。

  5. 点击 Run query 按钮。查询结果会显示在按钮下方。

    BigQuery 网页界面查询结果

以上查询访问 BigQuery 提供的公共数据集中的表。

要浏览其他公共数据集,您可以点击导航窗格中的 bigquery-public-data

将数据加载到表中

接下来,您要下载一些提供的数据,将数据加载到 BigQuery 表中,然后查询该数据。

下载数据

您要下载的文件由美国社会保障管理局提供,其中包含了约 7 MB 的热门婴儿姓名数据。

  1. 下载婴儿姓名 ZIP 文件

  2. 将该文件解压缩到您的机器上。

    该 ZIP 文件中包含一个描述数据集架构的 README 文件。 详细了解该数据集

  3. 打开名为 yob2014.txt 的文件,查看其具体内容。该文件是一个英文逗号分隔值 (CSV) 文件,其中包含以下三列:姓名、性别(MF)和取该姓名的儿童人数。该文件没有标题行。

  4. 请记下 yob2014.txt 文件的位置,以便于日后查找。

创建数据集

接下来,在经典版网页界面中创建数据集以用于存储数据。

  1. 转到经典版网页界面。

    转到经典版网页界面

  2. 在导航窗格中,点击相应项目名称旁边的向下箭头图标 向下箭头图标,然后点击 Create new dataset

  3. Create Dataset 对话框中执行以下操作:

    • Dataset ID 部分,输入 babynames
    • Data location 部分,选择 US。目前,公共数据集存储在 US 多区域位置。为简单起见,您应将数据集放在同一位置。
    • Data expiration 部分,请保留默认值 Never。如果将数据到期时间设置为“never”,则在数据集中创建的表永远不会自动删除。您必须手动删除这些表。

      创建数据集

    • 点击 OK

    每个项目的数据集 ID 都不得重复,因此,如果在导航窗格中相应项目名称下已列有 babynames,请向该名称附加一个数字,使其具有唯一性。点击问号图标可查看字段帮助。

将数据加载到新表中

接下来,将数据加载到新表中。

  1. 在导航窗格中,将鼠标悬停在您刚创建的 babynames 数据集上。

  2. 点击相应 ID 旁边的向下箭头图标 向下箭头图标图片,然后点击 Create new table

    babynames 向下箭头图标图片

    除非另有说明,否则所有设置均使用默认值。

  3. Source Data 中,点击 Choose file 按钮。导航至您之前解压缩的数据,然后选择 yob2014.txt 文件。

  4. Destination Table 部分,输入以下值作为目标表名称。

    names_2014
    
  5. Schema 部分,点击 Edit as Text 链接。

    “edit as text”链接

    然后将 Schema 输入区域的内容替换为以下架构定义:

    name:string,gender:string,count:integer
    
  6. 点击 Create Table 按钮。

  7. 等待 BigQuery 创建表和加载数据。 当 BigQuery 加载数据时,导航窗格中的相应表名称后面将显示一个 (loading) 字符串。在数据加载完毕之后,该字符串即会消失。

预览表

(loading) 字符串消失后,您便可以访问该表了。要预览前几行数据,请执行以下操作:

  1. 在导航窗格中选择 names_2014

  2. Table Details: names_2014 部分点击 Preview。

    BigQuery 网页界面表预览

查询表

现在,您已将数据加载到表中,接下来可以针对该表运行查询了。 此过程与上面的查询公共数据集示例相同,只是这一次您查询的是自己的表,而非公共数据集中的表。

  1. 点击 Compose query 按钮。

  2. 将以下查询复制并粘贴到 New Query 文本区域中。

    #standardSQL
    SELECT
      name,
      count
    FROM
      `babynames.names_2014`
    WHERE
      gender = 'M'
    ORDER BY
      count DESC
    LIMIT
      5
    
  3. (可选)在 Processing Location 部分,点击 Unspecified 并选择 US。如果您的数据集位于 US 多区域位置,系统会自动检测处理位置。

  4. 点击 Run query 按钮。该查询会针对您加载到表中的数据所对应的年份,显示其中最热门的 5 个男性姓名。

清理

为避免系统因本快速入门中使用的资源向您的 Google Cloud 帐号收取费用,请按照以下步骤操作。

  1. 如有必要,请打开经典版网页界面。

    转到经典版网页界面

  2. 在导航窗格中,将鼠标悬停在您创建的 babynames 数据集上。

  3. 在导航窗格中,点击相应数据集名称旁边的向下箭头图标 向下箭头图片,然后点击 Delete dataset。 此操作会删除相关数据集、表和所有数据。

  4. Delete dataset 对话框中,输入您数据集的名称 (babynames),然后点击 Delete 以确认删除命令。

后续步骤

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
需要帮助?请访问我们的支持页面