Looker 块

Looker Blocks 是适用于常见分析模式和数据源的预构建数据模型。重复利用他人已经完成的工作,而不是从头开始,然后根据具体的规范自定义数据块。从经过优化的 SQL 模式到完全内置的数据模型,Looker 块可以作为在 Looker 中快速灵活地进行数据建模的起点。

可用块

有许多 Looker Blocks 可供选择。如需了解目前有哪些屏蔽设置,请查看 Looker Marketplace 中的屏蔽设置部分。

Looker Blocks 旨在让您更加轻松高效地分析数据。它们是“按原样”提供的,这意味着今后将不再有更新。Looker 无法声明或保证这些数据将是准确、可靠或无错的。如需详细了解我们如何收集用户数据以及如何解读这些数据,请参阅相应文档。

点击您感兴趣的数据,查看具体的使用说明。

您可以使用 Looker Marketplace 快速轻松地安装某些 Looker Blocks。在通过 Looker Marketplace 部署屏蔽设置之前,Looker 管理员必须已启用市场功能。若要安装包含 local_dependency 参数的块,还需要启用本地项目导入 Labs 功能。参阅 Looker Marketplace 文档页面,详细了解如何安装和自定义 Looker Blocks(可从 Looker Marketplace 获得)。

标准化和自定义

在包含 local_dependency 参数的现有代码块上构建项目之前,Looker 管理员必须启用本地项目导入实验室功能。

使用不同数据块的难易程度取决于数据库架构标准化程度。大多数 Looker Blocks 都需要进行一些自定义设置来适应您的数据架构,但数据块除外,后者是最简单的实现方式,但不可自定义。

  • 数据块(包括公共数据集和完整的 LookML 模型)只需要从 GitHub 代码库中复制 LookML 模型即可访问根据模型估算的表。如需查看详细说明,请参阅本页面中的使用数据块

  • 数据收集应用(如 Segment 和 Snowplow)以相对标准化的格式跟踪事件。因此,我们能够创建模板化设计模式(支持数据清理、转换和分析),并且可供任何使用此类应用的客户使用。

  • 其他 Web 应用(例如 Salesforce)可让您为内部用户添加自定义字段。当然,这会以不太标准化的格式创建数据。因此,您可以使用模板设置部分数据模型来启动并运行分析,但您需要对非标准化部分进行自定义。

  • 最后,我们还提供了常规的业务数据洞见。这些是优化的 SQL 或 LookML 设计模式,与数据源无关。例如,许多公司都希望分析客户在一段时间内的生命周期价值。这些模式有一些假设条件,但它们可以根据您的具体业务需求进行自定义。这些模式反映了 Looker 对进行特定类型分析的最佳方式的观点。

如果您刚开始接触 Looker,您的 Looker 分析师可以帮助您充分利用这些模型。

向 LookML 添加块

  • 有些屏蔽块会同时显示“探索”和“查看”视图。这是为了便于查看,但一般而言,您需要将 LookML 的相应部分复制到数据模型中的适当位置。如需了解详情,请参阅了解模型和查看文件文档页面。
  • 在某些情况下,您可能需要在数据模型中创建新的 LookML 文件来存放示例。

使用数据块

数据块是特殊类型的 Looker 块,可提供数据集和数据模型。Looker 数据块包含公开数据源,例如:

  • 受众特征数据:美国社区调查在州、县、邮政编码制表区域甚至是人口普查区块级别的常见受众特征指标。
  • 天气数据:1920 年至前一天邮政编码级别美国的天气报告。此街区每晚更新一次。

如需查看当前可用的屏蔽的完整列表,请参阅 Looker Marketplace 中的屏蔽部分。

访问不同数据库上的数据集

访问数据块的数据集的过程因数据库架构而异。以下部分介绍了如何访问这些数据库上的数据集:

访问 Google BigQuery 上的数据集

如果您已有 Google BigQuery 帐号,则可以访问 Looker 的 BigQuery 托管数据集。请直接跳到本页面上的向项目添加数据块部分。

如果您还没有 Google BigQuery 帐号,可以先设置免费试用,然后访问 BigQuery 上的 Looker 公共数据集。

Google BigQuery 不支持跨区域共享项目。如需直接从美国区域访问 Google BigQuery 中的数据块,您可以执行以下操作:

访问 Snowflake 上的数据集

您可以访问 Looker 托管的 Snowflake 数据仓库,并使用数据共享来访问 Looker 的公共数据集。

Snowflake 不支持跨区域共享项目。如需直接从美国区域之外访问 Snowflake 中的数据块,您可以执行以下操作:

首先,提供以下信息,与您的 Looker 分析师联系:

  • 客户名称:<Company1>
  • Customer Looker 实例:<instance_name.looker.com>
  • Snowflake 帐号名称:<company1.snowflakecomputing.com>

Looker 的运营团队向 Snowflake 帐号提供对数据块的访问权限后,可以运行以下命令来访问 Looker 的公共数据集:

&#8208;&#8208; Data Consumer Side (* Need to be ACCOUNT ADMIN *)
&#8208;&#8208; For customers in us-west region
create database looker_datablocks from share looker.looker_share_datablocks;

&#8208;&#8208; For customers in us-east region
create database looker_datablocks from share gt97609.looker_share_datablocks;

grant imported privileges on database looker_datablocks to role sysadmin;

use role sysadmin;

grant imported privileges on database looker_datablocks to &#60;other_role&#62;;

show databases;

use looker_datablocks;

show tables;

如果您将 Looker 的某个公共数据集与您自己的 Snowflake 数据仓库搭配使用,您的 Looker 用户必须具有数据库写入权限才能创建 PDT。如需详细了解如何将 Looker 连接到 Snowflake,请参阅雪花配置文档页面。

访问其他数据库上的数据集

您正在使用 Amazon Redshift 吗?MySQL?PostgreSQL?Oracle?

我们在 GCS 和 S3 中公开了上述每个数据集的转换数据,以便您直接将其导入所选的数据库中。

我们还为 GitHub 代码库中的每个数据集提供了数据定义语言 (DDL)。您可能需要针对所选数据库中的数据类型修改 DDL 语句,但应该大致了解每个表的列类型。

直接从以下某个位置下载数据:

访问 LookML 模型

将我们的一个 GitHub 代码库克隆到新的 GitHub 代码库(由 Looker 或您的公司托管),然后您可以在实例中扩展优化

向项目添加数据块

除了本部分中介绍的方法外,您还可以使用 LookML 优化在项目中的视图和探索的 LookML 的基础上进行构建。

在使用 local_dependency 参数的数据块进行构建之前,Looker 管理员必须启用本地项目导入实验室功能。

如需向项目中添加数据块,请执行以下操作:

  1. 向 Looker 实例添加新项目

  2. 创建分支或复制上述 GitHub 代码库以访问预构建的 LookML。请务必创建新的 GitHub 代码库。

  3. 从代码库中移除其他数据库方言文件。Looker Blocks 通常包含 Google BigQuery、Amazon Redshift 和 Snowflake 的文件。例如,如果您要在 Google BigQuery 上设置数据块,则需要 Google BigQuery 视图文件、Google BigQuery 探索文件和 Google BigQuery 模型文件。

  4. 将模型文件中的连接名称替换为数据块数据所在的数据库连接;如果是 Google BigQuery 和 Snowflake,则使用您要扩展或优化的现有数据库连接:

    所有联接逻辑都存在于每个代码库的 .explore 文件中。这是您在设置项目清单后要在后续步骤中添加的文件。

  5. 在要扩展或优化数据块的主 Looker 项目中,创建项目清单文件

  6. 将以下 LookML 添加到项目清单文件中,以便引用主 Looker 项目中的数据块:

    project_name: "<your_project_name\>"

    local_dependency: {
      project: "<project_name_of_datablock\>"
    }

设置注意事项和选项

Google BigQuery:请务必使用一组根据模型估算的文件。如果您使用的是 Google BigQuery,则可能需要引用文件名中包含 _bq_ 的所有文件。您可能必须根据自己的数据库方言调整 Google BigQuery 模型方言。

Google BigQuery 不支持跨区域共享项目。如需直接从美国区域访问 Google BigQuery 中的数据块,您可以执行以下操作:

扩展程序:我们的所有项目都已设置为允许使用“探索”文件中的扩展程序,因为模型扩展程序可能会导致多个连接出现问题。

联接派生表:您可能需要查看我们的原生派生表文档。您可以让 Looker 在我们的公开数据集上以不同级别的汇总方式编写 SQL,并将其加入模型中。

合并结果集:您还可以选择通过组合查询结果集,将数据集内的结果集与您的数据合并。观看此短视频,详细了解如何合并数据。

受众特征数据集的设置示例

  1. 如需访问数据,请从我们的 S3 或 GCS 存储分区下载原始数据,或者连接到 Looker 数据库。

  2. 将 LookML 中的受众特征数据块模型作为 Looker 实例中的单独项目导入:

  3. 使用 include 参数导入视图文件。

  4. 然后,扩展优化视图文件,或者使用原生派生表,在探索级别所需的汇总级别获取数据。

    在我们的示例中,由于受众特征数据与电子商务数据集(屏蔽组与邮政编码)的汇总级别不同,因此我们使用原生派生的表格来汇总邮政编码级别的统计信息。这样可以消除混乱的多对多联接:

    include: "/american_community_survey/bq.explore"

    view: zipcode_income_facts {
      derived_table: {
        persist_for: "10000 hours"
        explore_source: fast_facts {
          column: ZCTA5 { field: tract_zcta_map.ZCTA5 }
          column: income_household { field: bg_facts.avg_income_house }
          column: total_population { field: bg_facts.total_population }
        }
      }
      dimension: ZCTA5 {}
      dimension: income_household {
        hidden: yes
      }
  1. 将视图文件联接到模型中:
    include: "acs*.view"

    explore: order_items {
      join: users {
        sql_on: ${users.id} = ${order_items.user_id} ;;
        type: left_outer
        relationship: many_to_one
      }

      join: zipcode_income_facts {
        sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;;
        type: left_outer
        relationship: many_to_one
      }
    }
  1. 探索您的数据:

  2. 直观呈现您的数据:

使用可视化块

Looker 提供多种原生可视化类型。但是,如果您有 Looker 的原生可视化类型未涵盖的图表需求,则还可以添加自己的自定义可视化图表类型。您还可以开发自定义图表,并面向 Looker Marketplace 中的所有 Looker 用户提供。

Viz 块是由 Looker 托管的预构建 JavaScript 可视化类型。您可以将 Viz 块添加到 Looker 实例,这些块的行为类似于 Looker 的任何原生可视化类型:它们显示在可视化菜单栏中,并且包含钻孔、下载、嵌入和调度等核心功能。

如需详细了解可视化块,请在 Looker Marketplace 的插件部分选择可视化类型,然后点击查看代码并导航到可视化块的 READ.ME 文件。READ.ME 文件显示了可视化图表的一个示例,并提供了有关可视化块的更多信息。对于某些可视化图表,READ.ME 文件还提供了用于添加可视化块的网址和说明。

如需向实例添加可视化类型,请参阅 READ.ME 文件(如果有)中的说明以及可视化图表文档页面上的信息。