快速入门:使用数据洞察

借助 BigQuery BI Engine,您可以使用由 BigQuery 支持的报告和信息中心执行快速、低延迟的分析服务和交互式分析。

本入门教程适用于使用 Google Data Studio 构建报告和信息中心的数据分析师和业务分析师。

目标

在本教程中,您将执行以下操作:

  • 使用 BigQuery 管理控制台创建 BI Engine 容量预留。
  • 使用数据洞察连接到由 Big Engine 托管的 BigQuery 表格。
  • 创建一个数据洞察信息中心,以查询 BI Engine 托管的表格。

费用

本教程使用 Google Cloud 的以下收费组件:

  • BI Engine:您在 BI Engine 中创建预留时会产生费用。
  • BigQuery:您在 BigQuery 中创建表时会产生存储费用。

如需详细了解 BI Engine 价格,请参阅价格页面。

如需详细了解 BigQuery 存储价格,请参阅 BigQuery 文档中的存储价格

准备工作

在开始之前,请确保您有一个要使用的项目,您已为该项目启用结算功能,并且已启用 BigQuery API。

  1. 登录您的 Google Cloud 帐号。如果您是 Google Cloud 新手,请创建一个帐号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  3. 确保您的 Cloud 项目已启用结算功能。 了解如何确认您的项目是否已启用结算功能

  4. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  5. 确保您的 Cloud 项目已启用结算功能。 了解如何确认您的项目是否已启用结算功能

  6. 新项目会自动启用 BigQuery API。 如需在现有项目中启用 BigQuery API,请转到 启用 BigQuery API。

    启用 API

创建 BigQuery 数据集

第一步是创建 BI Engine 数据集以存储由 BI Engine 托管的表。如需创建数据集,请按照下列步骤操作:

  1. 在 Cloud Console 中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在导航面板的 Explorer 面板中,点击您的项目名称。

  3. 在详细信息面板中,点击创建数据集

  4. 创建数据集 页面上,执行以下操作:

    • 数据集 ID 部分,输入 biengine_tutorial
    • 选择美国 (US) 作为数据位置。目前,公共数据集存储在 US 多地区位置。为简单起见,我们建议您将数据集放在同一位置。

      创建数据集页面

  5. 保留所有其他默认设置不变,然后点击创建数据集

通过复制公共数据集中的数据来创建表

本教程使用通过 Google Cloud 公开数据集计划提供的数据集。公共数据集由 BI Engine 托管,可供您访问并集成到您的应用中。

在此部分中,您将通过从 San Francisco 311 service requests 数据集复制数据来创建表。您可以使用 Cloud Console 来浏览数据集。

创建表

如需创建表,请按照下列步骤操作:

  1. 在 Cloud Console 中,打开 SF 311 数据集。

    转到 SF 311 数据集

  2. 在导航窗格中,展开 san_francisco_311,然后点击 311_service_requests 表。

  3. 点击复制表

  4. 复制表对话框的目标位置部分中,执行以下操作:

    • 项目名称部分,选择您的项目。
    • 数据集名称部分,确保已选择 biengine_tutorial
    • 表名称部分,输入 311_service_requests_copy

      复制 SF 311 表

    • 点击复制

  5. 复制作业完成后,您可以通过展开 PROJECT_NAME > biengine_tutorial 并点击 311_service_requests_copy > 预览来验证表内容。

创建 BI Engine 预留

  1. 在 BigQuery 管理控制台中,转到 BI Engine 页面。

    转到 BigQuery 管理控制台

  2. 点击创建预留

  3. 创建预留页面上,第 1 步是:

    • 验证您的项目名称。
    • 选择您的位置。该位置应该与您要查询的数据集的位置相匹配。
    • 将滑块调整到要保留的内存容量。以下示例会将容量设置为 2 GB。当前最大值为 10 GB。

      BI Engine 容量位置

  4. 点击下一步

  5. 第 2 步是查看您的预留详情,然后点击下一步

  6. 第 3 步是查看协议,然后点击创建

  7. 确认预留后,详细信息会显示在预留页面上。

    已确认预留

在数据洞察中创建数据源连接

在 Google 数据洞察中创建报告之前,必须为该报告创建数据源。一份报告可以有一个或多个数据源。 Google 数据洞察使用 BigQuery 连接器连接到 BI 引擎托管的 BigQuery 表。

在数据洞察中定义数据源连接时,BI Engine 将使用您配置的表和列来确定要缓存的数据。BI Engine 仅缓存添加到报告中的列。

所需权限

您必须具有相应的权限才能将 BigQuery 数据源添加到 Google Data Studio 报告中。此外,应用于 BigQuery 数据集的权限也会应用于您在 Google Data Studio 中创建的报告、图表和信息中心。共享 Google Data Studio 报告时,只有具备适当权限的用户才能看到报告组件。

需要 bigquery.jobs.create 权限才能运行用于填充报告的查询作业。为了成功完成查询作业,用户或群组必须有权访问包含查询引用的表的数据集。最少需要具备映射到该数据集的 bigquery.dataViewer 角色的“可查看”访问权限。

由于您创建了本教程所使用的数据集,因此您将被授予对数据集的“为所有者”访问权限,您可以完全控制该数据集。同时,由于您创建了本教程所使用的项目,因此您在项目级层拥有“所有者”访问权限。“所有者”访问权限可让您在项目中运行作业。

权限详情

您可以通过授予以下任意一个预定义 IAM 角色,在项目级层设置 bigquery.jobs.create 权限:

  • bigquery.user
  • bigquery.jobUser
  • bigquery.admin

如果您向用户或群组授予项目级层的 bigquery.user 角色,则在默认情况下,系统不会向其授予该项目中任何数据集、表或视图的访问权限。具有 bigquery.user 角色的用户可以创建自己的数据集,还可对其已获访问权限的数据集运行查询作业。如果您分配了 bigquery.userbigquery.jobUser 角色,那么还必须分配对用户或群组需要访问但并非由用户创建的每个数据集的访问权限控制

在分配对数据集的访问权限时,共有 3 个选项:

如果用户要运行查询,则至少需要具备“可查看”访问权限。

如需详细了解 BigQuery 中的 IAM 角色,请参阅 BigQuery 文档中的访问控制

如需详细了解如何在 BigQuery 中确保数据集的安全,请参阅 BigQuery 文档中的控制对数据集的访问权限

创建数据源

如需创建数据源,请执行以下操作:

  1. 打开 Google 数据洞察

  2. 报告页面的“开始创建新的报告”部分中,点击空白模板。这会创建一份新的无标题报告。

    空白模板

  3. 看到系统提示时,填写营销首选项以及帐号和隐私设置,然后点击保存。保存设置后,您可能需要再次点击空白 (Blank) 模板。

  4. 添加数据源窗口中,点击创建新数据源

    添加数据源

  5. Google 连接器部分中,将鼠标悬停在 BigQuery 上方,然后点击选择

  6. 授权部分,点击授权。这允许 Google 数据洞察访问您的 Google Cloud 项目。

  7. 请求权限 (Request for permission) 对话框中,点击允许以允许 Google 数据洞察查看 BigQuery 中的数据。如果您以前使用过 Google Data Studio,则可能不会收到此提示。

  8. 我的项目保持选中状态,然后在项目窗格中点击项目名称。

  9. 数据集窗格中,点击 biengine_tutorial

  10. 窗格中,点击 311_service_requests_copy

  11. 在窗口的右上角,点击连接。Google Data Studio 连接到 BigQuery 数据源后,系统会显示表的字段。您可以使用此页面调整字段属性,或者创建新的计算字段。

  12. 点击右上角的添加到报告

  13. 出现提示时,点击添加到报告

  14. 请求权限 (Request for permission) 对话框中,点击允许以允许数据洞察查看和管理 Google 云端硬盘中的文件。如果您以前使用过 Google 数据洞察,则可能不会收到此提示。

创建图表

将数据源添加到报告之后,接下来是创建可视化。首先创建一个条形图。您创建的条形图会按社区显示热门投诉。

如需创建一个条形图以按社区显示投诉,请按如下方法操作:

  1. (可选)在页面顶部,点击未命名报告以更改报告名称。例如,输入 BI Engine tutorial

  2. 报告编辑器加载完成后,点击插入 > 条形图

  3. 使用手柄,展开图表的大小。

  4. 数据标签页上,注意数据源的值为 311_service_requests_copy

  5. 由于您要按社区绘制请求人数图表,因此需要将维度设置为 category,将“细分”维度设置为 neighborhood。点击默认维度(可能为 status),然后在列表中选择类别

    选择类别维度

  6. 可用字段列表中,点击社区并将其拖到细分维度下的在此处添加维度框中。

    添加社区维度

添加过滤条件

由于数据包含 neighborhood 列中的多个 NULL 值,因此您添加了一个过滤条件以从图表中排除 NULL 值。

要添加过滤条件,请按以下步骤操作:

  1. 数据标签页上,点击添加过滤条件

    添加过滤条件选项

  2. 创建过滤条件对话框中执行以下操作:

    • 名称部分,输入 Exclude nulls
    • 确认数据源已设置为 311_service_requests_copy
    • 点击包括,然后选择排除
    • 点击选择字段,然后选择社区
    • 点击选择条件,然后选择为空

      已填写过滤条件

    • 点击保存

  3. 应用过滤条件后,您的图表应如下所示。

    已完成创建条形图

清除数据

为避免系统因本快速入门中使用的资源向您的 Google Cloud 帐号收取费用,您可以删除项目和/或 BI Engine 预留。

删除项目

为了避免产生费用,最简单的方法是删除您为本教程创建的项目。

要删除项目,请执行以下操作:

  1. 在 Cloud Console 中,转到管理资源页面。

    转到“管理资源”

  2. 在项目列表中,选择要删除的项目,然后点击删除
  3. 在对话框中输入项目 ID,然后点击关闭以删除项目。

删除预留

或者,如果您打算保留该项目,则可以通过删除容量预留来避免产生额外的 BI Engine 费用。

要删除预留,请按以下步骤操作:

  1. 在 BigQuery 管理控制台中,转到 BI Engine 页面。

    转到 BigQuery 管理控制台

  2. 预留部分,找到您的预留。

  3. 操作列中,点击预留右侧的图标,然后选择删除

  4. 确认删除预留对话框中,输入 REMOVE,然后点击继续

后续步骤