使用 BI Engine 和 Looker 分析数据

Looker 是一个提供商业智能、数据应用和嵌入式分析的企业级平台。Looker 可帮助您探索、共享和直观呈现公司的数据,以便做出更明智的业务决策。

Looker 的工作原理

Looker 可让每个组织的数据专家使用一种名为 LookML 的轻量级建模语言来描述其数据。LookML 告知 Looker 如何查询数据,因此组织中的每个人都可以创建方便阅读的报告和信息中心来探索数据模式。Looker 提供了创建自定义数据应用和体验的其他功能。

Looker 的平台支持 Oracle 和 MySQL 等事务型数据库以及 BigQuery、Snowflake、Redshift 等分析型数据存储区。通过 Looker,您可以快速准确地在所有数据之上创建一致的数据模型。Looker 提供一个统一途径,可供您访问组织的所有数据。

Looker 与 BigQuery 的集成

Looker 支持在 Google Cloud 中托管。由于 Looker 与平台无关,因此它会连接到 BigQuery 中的数据以及其他公有云。

您无需 Looker 即可使用 BigQuery。但是,如果您的 BigQuery 使用场景包括商业智能、数据应用或嵌入式分析,您可能需要查看 Looker(作为这些服务的提供商)。

如果您已运行 Looker 实例,请参阅将 Looker 连接到 BigQuery 的说明

Looker 和 BigQuery 使用入门

BI Engine SQL 接口扩展了 BI Engine 以与商业智能 (BI) 工具(如 Looker)集成。如需了解详情,请参阅 BigQuery BI Engine SQL 接口概览

创建 BigQuery 数据集

第一步是创建用于存储由 BI Engine 托管的表的 BigQuery 数据集。如需创建数据集,请按照下列步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 在导航面板的 Explorer 面板中,点击您的项目名称。

  3. 在详细信息面板中,点击 查看操作,然后点击创建数据集

  4. 创建数据集页面上,执行以下操作:

    • 数据集 ID 部分,输入 biengine_tutorial
    • 数据位置部分,选择 us(美国的多个区域),即存储公共数据集的多区域位置

    • 在本教程中,您可以选择启用表过期时间,然后指定表在多少天后过期。

      创建数据集页面

  5. 保留所有其他默认设置不变,然后点击创建数据集

通过复制公共数据集中的数据来创建表

本教程使用通过 Google Cloud 公共数据集计划提供的数据集。公共数据集是由 BigQuery 托管的数据集,可供您访问并集成到您的应用中。

在此部分中,您将通过从 San Francisco 311 service requests 数据集复制数据来创建表。您可以使用 Google Cloud 控制台浏览数据集。

创建表

如需创建表,请按照下列步骤操作:

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 浏览器面板中,搜索 san_francisco_311

  3. 浏览器面板中,展开 san_francisco_311,然后点击 311_service_requests 表。

  4. 在“浏览器”工具栏中,点击复制

    突出显示的复制选项。

  5. 复制表对话框的目标位置部分中,执行以下操作:

    • 对于项目名称,点击浏览,然后选择您的项目。
    • 对于数据集名称,选择 biengine_tutorial
    • 对于表名称,输入 311_service_requests_copy

      包含目标选项的“复制表”窗口

  6. 点击复制

  7. 可选:完成复制作业后,展开 PROJECT_NAME > biengine_tutorial 并点击 311_service_requests_copy > 预览,以验证表内容。将 PROJECT_NAME 替换为本教程中的 Google Cloud 项目的名称。

创建 BI Engine 预留

  1. 在 Google Cloud 控制台中的管理下,转到 BI Engine 页面。

    进入 BI Engine 页面

  2. 点击 创建预留

  3. 创建预留页面上,配置您的 BI Engine 预留:

    • 项目列表中,验证您的 Google Cloud 项目。
    • 位置列表中,选择一个位置。该位置应该与您要查询的数据集的位置相匹配。
    • 容量 (GiB) 滑块调整到要预留的内存容量。以下示例将容量设置为 2 GiB。最大值为 250 GiB。

      BI Engine 容量位置

  4. 点击下一步

  5. 首选表部分中,可以选择指定进行 BI Engine 加速的表。如需查找表名称,请执行以下操作:

    1. 表 ID 字段中,输入您希望 BI Engine 加速的表名称的一部分,例如 311
    2. 从建议的名称列表中,选择您的表名称。

      只有指定的表才可以加速。如果未指定首选表,则所有项目查询都可以加速。

  6. 点击下一步

  7. 确认并提交部分中,查看协议。

  8. 如果您接受协议条款,请点击创建

确认预留后,详细信息会显示在预留页面上。

已确认预留

使用 Looker 进行连接

以下说明介绍了如何使用 BigQuery 设置 Looker。

  1. 以管理员身份登录 Looker。
  2. 在关于 BigQuery 的 Looker 文档中,完成以下部分:

    1. 创建服务账号
    2. 在 Looker 中为 BigQuery 连接配置 OAuth
  3. 点击开发标签页,然后选择 开发模式

  4. 为您的数据集生成 LookML 模型和项目。如需了解详情,请参阅有关将 Looker 连接到数据库的说明

  5. 使用探索菜单导航到与新模型文件名 Explore 311_service_requests_copy(或您为探索进行的命名)相关的探索。

您已成功将 Looker 连接到 BigQuery。您可以使用 Looker 中的“系统活动”功能生成 Looker 使用情况报告,并根据 BigQuery 专用的性能指标分析查询的性能。如需了解各种 BigQuery BI Engine 查询性能指标,请参阅 BigQuery BI Engine 指标

清理

为避免系统因本快速入门中使用的资源向您的 Google Cloud 账号收取费用,您可以删除项目和/或 BI Engine 预留。

删除项目

要避免产生费用,最简单的方法是删除您为本教程创建的项目。

如需删除项目,请执行以下操作:

  • 项目中的所有内容都会被删除。如果您在本教程使用现有项目,则删除该项目后,还将删除您已在该项目中完成的其他所有工作。
  • 自定义项目 ID 丢失。创建此项目时,您可能创建了要在将来使用的自定义项目 ID。要保留使用该项目 ID 的网址(例如 appspot.com 网址),请删除项目内的所选资源,而不是删除整个项目。如果您打算探索多个教程和快速入门,重复使用项目可以帮助您避免超出项目配额上限。
  1. 在 Google Cloud 控制台中,进入管理资源页面:

    进入 BI Engine 页面

  2. 在项目列表中,选择要删除的项目,然后点击删除

  3. 在对话框中输入项目 ID,然后点击关停以删除项目。

删除预留

或者,如果您打算保留该项目,则可以通过删除容量预留来避免产生额外的 BI Engine 费用。

要删除预留,请按以下步骤操作:

  1. 在 Google Cloud 控制台中的管理下,转到 BI Engine 页面。

    进入 BI Engine 页面

  2. 预留部分,找到您的预留。

  3. 操作列中,点击预留右侧的 图标,然后选择删除

  4. “删除预留吗?”对话框中,输入删除,然后点击删除

后续步骤

关于管理 Looker、自定义其数据模型以及向用户公开数据,还有许多其他相关选项。如需了解详情,请参阅以下资源: