Looker 块

Looker BlocksTM 是预构建的数据模型,适用于常见的分析模式和数据源。重复使用其他人已经完成的工作(而不是从头开始),然后根据您的确切规范自定义这些块。从经过优化的 SQL 模式到完全内置的数据模型,Looker Blocks 可以用作起点,在 Looker 中快速、灵活地进行数据建模。

可用的组成要素

有多个 Looker 模块可供选择。如需查看可用的屏蔽设置,请查看 Looker Marketplace屏蔽设置部分。

点击您感兴趣的块以查看其具体使用说明。

某些 Looker 块可以使用 Looker Marketplace 快速安装。Looker 管理员必须先启用 Marketplace 功能,然后才能通过 Looker Marketplace 部署块。安装包含 local_dependency 参数的块还需要启用本地项目导入 实验室功能。如需详细了解如何安装和自定义 Looker Marketplace(可从 Looker Marketplace 获取),请参阅 Looker Marketplace 文档页面。

标准化和自定义

使用不同块的难易程度因数据库架构的标准化程度而异。大多数 Looker 块都需要进行一些自定义才能契合您的数据架构,但数据块除外,它们最易于实现,但无法自定义。

  • 数据块(包括公共数据集和完整的 LookML 模型)只需从 GitHub 代码库复制 LookML 模型即可访问建模表。有关详细说明,请参阅本页中的使用数据块

  • 数据收集应用(如 Segment 和 Snowplow)以相对标准化的格式跟踪事件。这样一来,就可以创建模板化设计模式(能够进行数据清理、转换和分析),以供任何使用这些应用的客户使用。

  • 其他 Web 应用(例如 Salesforce)可让您为内部用户添加自定义字段。当然,这样会以不太标准化的格式创建数据。因此,我们可以对部分数据模型进行模板化,以便启动并运行分析,但您需要自定义非标准化部分。

  • 最后,我们还为常规业务数据洞见设置了一些限制。这些是优化的 SQL 或 LookML 设计模式,与数据源无关。例如,许多公司都希望分析客户在一段时间内的生命周期价值。这些模式中包含了一些假设,但您可以根据自己的特定业务需求对其进行自定义。这些模式反映了 Looker 对进行特定类型的分析的最佳方式的看法。

如果您刚开始接触 Looker,Looker 分析师可帮助您充分利用这些模型。

向 LookML 中添加块

  • 一些块会在同一文件中同时显示探索和视图。这便于查看,但一般来说,您需要将 LookML 的相应部分复制到数据模型的相应位置。如需了解详情,请参阅了解模型和视图文件文档页面。
  • 在某些情况下,您可能需要在数据模型中创建新的 LookML 文件以存放这些示例。

使用数据块

数据块是一种特殊的 Looker 块,可提供数据集和数据模型。Looker 数据块包含公开数据源,例如:

  • 受众特征数据:美国社区调查提供的常见受众特征指标,涵盖州、县、邮政编码制表区甚至人口普查街区组级别。
  • 天气数据:1920 年至前一天的美国邮政编码级别天气报告。此块每晚更新。

如需查看可用块的完整列表,请参阅 Looker Marketplace部分。

访问不同数据库上的数据集

访问数据块数据集的过程因数据库架构而异。以下部分介绍如何访问这些数据库中的数据集:

访问 Google BigQuery 上的数据集

如果您已有 Google BigQuery 帐号,则可以访问 Looker 的 BigQuery 托管的数据集。请直接跳到本页面的向项目添加数据块部分。

如果您还没有 Google BigQuery 帐号,可以设置免费试用,然后在 BigQuery 上访问 Looker 的公共数据集。

访问其他数据库上的数据集

您使用的是 Amazon Redshift、MySQL、PostgreSQL 或 Oracle 吗?

我们已在 Google Cloud 服务和 S3 中公开提供每个数据集的转换数据,以便您可以直接将其导入至您选择的数据库中。

我们还为 GitHub 代码库中的每个数据集提供了数据定义语言 (DDL)。可能需要为所选数据库中的数据类型修改 DDL 语句,但您应该可以了解每个表的列类型。

直接从以下某个位置下载数据:

访问 LookML 模型

将我们的某个 GitHub 代码库克隆到新的 GitHub 代码库(由 Looker 或您的公司托管),然后在您的实例中扩展优化该代码库:

向项目添加数据块

除了本部分中介绍的方法之外,您还可以使用 LookML 优化在项目中视图和探索的 LookML 的基础上进行构建。

如需向项目添加数据块,请执行以下操作:

  1. 向您的 Looker 实例添加新项目

  2. 对之前提到的 GitHub 代码库进行复刻或复制操作,以访问预构建的 LookML。请务必创建一个新的 GitHub 代码库。

  3. 从代码库中移除其他数据库方言文件。Looker Blocks 通常包含 Google BigQuery、Amazon Redshift 和 Snowflake 文件。例如,如果您要在 Google BigQuery 上设置数据块,则需要 Google BigQuery 视图文件、Google BigQuery 探索文件和 Google BigQuery 模型文件。

  4. 将模型文件中的连接名称替换为数据块所在的数据库连接。如果您使用的是 Google BigQuery 或 Snowflake,请使用要扩展或优化的数据库连接。

    所有联接逻辑都存在于每个代码库的 .explore 文件中。设置项目清单后,您将在后续步骤中添加此文件。

  5. 在要扩展或优化数据块的主 Looker 项目中,创建项目清单文件

  6. 将以下 LookML 添加到项目清单文件中,以引用 Looker 主项目中的数据块:

    project_name: "<your_project_name\>"

    local_dependency: {
      project: "<project_name_of_datablock\>"
    }

设置注意事项和选项

Google BigQuery:请务必使用一组正确的根据模型估算的文件。如果您使用的是 Google BigQuery,则可能需要引用文件名中包含 _bq_ 的所有文件。您可能需要调整 Google BigQuery 模型方言,使其适合您自己的数据库方言。

扩展程序:我们的所有项目都已设置为允许“探索”文件使用扩展程序,因为模型扩展程序可能会导致多个连接出现问题。

联接派生表:您可能需要查看有关原生派生表的文档。您可以让 Looker 针对我们公开提供的数据集以不同汇总级别为您编写 SQL,并将这些数据联接到您的模型中。

合并结果集:您还可以选择通过合并查询结果集,将我们数据集中的结果集与您的数据合并

受众特征数据集的设置示例

  1. 从我们的 S3 或 Google Cloud 服务存储分区下载原始数据,或连接到 Looker 数据库,从而获取数据访问权限。

  2. 从 LookML 导入受众特征数据块模型,将其作为 Looker 实例中的单独项目。

  3. 使用 include 参数引入视图文件。

  4. 然后,扩展优化视图文件,或者利用原生派生表获取探索所需的汇总级别数据。

    在我们的示例中,由于受众特征数据的汇总级别与我们的电子商务数据集(块组与邮政编码)不同,因此我们使用原生派生表汇总统计数据,最高可达邮政编码级别。这样可以避免混乱的多对多联接:

      include: "/american_community_survey/bq.explore"
    
      view: zipcode_income_facts {
        derived_table: {
          persist_for: "10000 hours"
          explore_source: fast_facts {
            column: ZCTA5 { field: tract_zcta_map.ZCTA5 }
            column: income_household { field: bg_facts.avg_income_house }
            column: total_population { field: bg_facts.total_population }
          }
        }
        dimension: ZCTA5 {}
        dimension: income_household {
          hidden: yes
        }
    
  5. 将视图文件联接到模型中:

      include: "acs*.view"
    
      explore: order_items {
        join: users {
          sql_on: ${users.id} = ${order_items.user_id} ;;
          type: left_outer
          relationship: many_to_one
        }
    
        join: zipcode_income_facts {
          sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;;
          type: left_outer
          relationship: many_to_one
        }
      }
    
  6. 探索直观呈现数据。

使用可视化块

Looker 提供多种内置可视化类型。但是,如果您的图表需求不在 Looker 的内置可视化图表类型涵盖范围内,您还可以添加自己的自定义可视化图表类型。您还可以开发自定义可视化图表,并通过 Looker Marketplace 将其提供给所有 Looker 用户。

Viz 块是由 Looker 托管的预构建 JavaScript 可视化类型。您可以将可视化块添加到 Looker 实例中,这些块的运作方式与 Looker 的任何内置可视化类型都类似:它们显示在可视化菜单栏中,并包含诸如深入分析、下载、嵌入和时间安排等核心功能。

如需详细了解可视化块,请在 Looker Marketplace 的插件部分中选择可视化类型,然后点击查看代码并前往可视化块的 READ.ME 文件。READ.ME 文件显示了一个可视化图表示例,并提供了有关可视化块的更多信息。对于某些可视化图表,READ.ME 文件还会提供一个网址,以及有关如何添加可视化块的说明。

如需向实例添加可视化类型,请参阅 READ.ME 文件(如果有)中的说明以及我们的可视化图表文档页面中的信息。