创建和修改探索

本页面介绍了如何使用 Looker 进行数据探索。请阅读以下部分,了解这些 Looker 概念:

如需详细了解“探索”页面上的组件以及如何与“探索”数据互动,请访问查看“探索”并与之互动文档页面。

探索是探索的起点

探索是查询的起点,用于探索特定主题领域。左侧导航面板中选择探索选项,以打开探索菜单。

探索菜单会显示许多按字母数字顺序整理的描述性模型或组名称。在探索菜单中,您可以搜索并选择“探索”,这些探索按字母顺序排列在其所属的模型或组名称下。

例如,如果您经营一家电子商务商店,则可以使用探索菜单查找包含“探索”功能的模型或群组,以便查看电子商务商店数据。

您可以通过展开或收起探索菜单中的模型或组名称来显示“探索”列表。选择“探索”的名称即可打开“探索”页面。

例如,“电子商务”商店模式包含“探索”“订单商品”(与订单关联的商品)、“订单”(购买事件)、“商品”(与商品目录商品相关的信息)和“用户”(与购买事件关联的个人)。如果您对与订单关联的商品有疑问,不妨选择订单商品“探索”工具。

探索包含视图,即维度和测量的分组。“探索”中显示的数据取决于您从左侧字段选择器中列出的视图中选择的维度和测量值。维度可以视为一组数据或一组数据。测量是指该数据存储桶的相关信息。在“探索数据”表格中,维度显示为蓝色列,测量值显示为橙色列。

例如,要显示每天的订单数量,用户可以从订单商品探索的订单视图中选择创建日期维度和数量

如果探索包含根据模型估算的查询,您可以使用“快速入门”分析来填充字段。下一部分将深入介绍快速入门分析以及如何将其用作探索数据的切入点。

快速入门分析

“探索”部分提供了根据模型估算的查询作为“快速入门”分析选项。“快速入门”分析是快速运行分析和建立分析的有用起点。

“快速入门”分析卡片显示在空白“探索”中的字段选择器右侧。每个“快速入门”分析卡片都会显示分析的名称和说明(如果有)。

如需详细了解开发者如何为用户构建预构建分析模型,请参阅 query 参数文档页面。

从空白的“探索”中选择“快速入门”选项

如需运行“快速入门”分析,请选择要探索的分析选项。查询将自动运行并显示结果,包括可视化图表。

在“快速入门”分析运行后,您可以通过从所有字段标签页、搜索结果或字段选择器中的正在使用标签页中添加移除字段来修改该分析。

探索运行后选择“快速入门”选项

探索运行完毕后,您可以选择“探索”名称旁边的快速入门闪电图标,选择新的“快速入门”分析。

选择此图标可打开快速入门菜单,其中显示可用的分析卡。

从菜单中选择“快速入门”分析即可运行该分析,并替换之前所有的“探索”结果(现有过滤条件除外)。

“快速入门”过滤条件行为

过滤条件可累加。也就是说,在运行“快速入门”分析时,它会包含任何现有的“探索”过滤条件。如果所选“快速开始”分析的过滤条件值与现有“探索”过滤条件冲突,系统会提示您选择要在分析中使用的过滤条件值。

例如,您当前查看的是包含以下过滤条件的“探索”查询的结果:

  • Orders Created Date 为“2019”年份。
  • Orders Status(订单状态)设置为“完成”。
  • Users State(用户状态)为“Washington”。

您想选择一项名为 CA 每月订单数的新快速启动分析,以按月份显示 2019 年在加利福尼亚州的订单数量。

选择快速入门闪电图标以打开“快速入门”菜单,然后选择 CA 每月订单计数分析选项:

“CA 订单数(按月)”分析中的“用户状态”过滤条件的过滤条件值存在冲突。Choose filter set 菜单会打开,系统会提示您通过选择 Keep current filters 选项(列出当前过滤器值)或 Replace with new filters 选项(列出所选快速启动分析的过滤器值)解决冲突。

要解决“选择过滤条件集”菜单中的冲突,请按以下步骤操作:

  1. 选择相应选项。
    • 选择保留当前过滤条件,以使用现有过滤条件值运行新的分析(在本例中,用户状态为“华盛顿州”)。
    • 选择替换为新的过滤条件,以使用预构建的过滤条件运行新的分析(在本例中,用户状态等于“加利福尼亚州”)。
  2. 选择应用以确认选择并运行分析。

使用更新后的用户状态为“加利福尼亚州”过滤条件运行“探索”,且包含所有现有的非冲突过滤条件(订单创建日期为“2019 年”,订单状态为“完成”)。

添加更多维度以获取更多详细信息

无论您是手动向“探索”页面添加字段,还是选择快速入门选项,都可以添加更多维度来详细了解您的数据。

要添加字段,请按以下步骤操作:

  1. 字段选择器中选择一个字段以将其添加到查询中。
  2. 选择运行按钮以重新运行查询。

例如,在包含创建订单日期订单计数的“探索”中选择订单状态维度,就会显示处于“已完成”、“待处理”或“已取消”状态的订单数量(按天显示)。

字段选择器

字段选择器位于“探索”页面的左侧,从上到下包含以下元素:

  1. “探索”名称会显示当前探索的名称。如果探索包含根据模型估算的查询,系统还会显示快速入门闪电图标。通过该图标,您可以在“探索”功能运行后使用“快速入门”分析选项。
  2. 用户可以使用查找字段搜索栏搜索与特定字词和条件匹配的字段。
  3. 所有字段标签页会显示探索的所有可用字段。
  4. 使用中标签页会显示当前正在使用的所有“探索”字段。
  5. 视图级摘要显示视图中所选字段的总数。此数字在视图收起和展开时显示。
  6. 特定字段的信息和操作图标用于显示“探索”查询中某个字段的当前函数和潜在函数,以及有关某个字段的更多详情。

  7. “探索”摘要在左下角显示“探索”中的字段总数(在权限允许的情况下,包括自定义字段和表计算),并在右下角显示转到 LookML 链接。前往 LookML 会将用户定向到其 LookML 项目中的 explore 定义。只有拥有 see_lookml 权限的用户才能看到此链接。

特定字段的信息和操作

每个字段旁的图标提供了有关该字段的更多信息,并指明了该字段的可用选项。将光标悬停在某个字段上时,可以看到这些图标。

您可以选择一个图标,根据字段的数据类型对包含字段的查询执行多项更改(包括按字段过滤或透视)。您还可以使用图标查看字段的相关信息,或在权限允许的情况下,根据该字段创建自定义字段。

这些图标会显示在所有字段正在使用标签页中。

可用的图标和功能包括:

  1. 透视数据图标 - 选择此图标可在“探索”中对字段进行透视或逆透视。如果字段未透视,此图标将显示为灰色;当字段进行透视时,此图标会显示为粗体。
  2. 按字段过滤图标 - 选择此图标可按字段过滤查询结果,或移除字段作为过滤条件。如果某个字段不是有效的过滤器,此图标会显示为灰色;如果是有效的过滤器,此图标会显示为粗体。

  3. 信息图标 info - 选择此图标可打开一个弹出式窗口,详细了解相应字段:

    • 弹出式窗口会为所有用户显示该字段的数据类型、说明(如果有)和 LookML 字段名称(采用 view_name.field_name 语法)。
    • 对于拥有 see_lookml 权限的用户,弹出式窗口将包含 LookML 字段的 sql 参数的定义,以及用于转到 LookML 项目中该字段的链接。

  4. 在某些情况下,用户可以使用三点状更多菜单

    拥有 create_custom_fields 权限的用户可以使用三点状更多菜单,根据字段类型快速创建自定义字段

“所有字段”标签页

当您打开现有“探索”时,系统会默认显示所有字段标签页。此标签页是构建“探索”的起点,并显示可为查询选择的所有可用字段。字段在定义字段的视图视图标签名称下,按类型(维度,后跟测量)字母数字顺序进行整理。每个字段都会显示特定于字段的信息和操作,例如“探索”查询中某个字段的当前函数和潜在函数。

“所有字段”标签页,其中光标悬停在“利润”维度上。

在查询中选择的字段会以灰色背景突出显示,对应的字段图标(数据透视、过滤器)将以粗体显示,而无需将指针悬停在某个字段处于活跃状态时。例如,上述字段选择器示例中的字段利润会突出显示为灰色,表示已选中该字段。您可以看出,此字段未进行透视或过滤,因为所有对应的字段图标都不是粗体,并且当您将鼠标悬停在该字段上时,图标不会显示。

所有字段标签页中选择一个字段,将其添加到“探索”查询中或从中移除。此外,您可以在所有字段标签页中选择相应的字段图标,以过滤、透视或执行其他操作针对特定字段的操作

自定义字段表格计算列在自定义字段视图标签下。拥有 create_table_calculations 权限的用户可以创建和修改表计算;拥有 create_custom_fields 权限的用户可以创建和修改自定义字段,方法是选择视图标签旁边的添加按钮,或者从字段的三点状菜单中选择更多选项。

“使用中”标签页

使用中标签显示探索中当前处于活动状态的所有字段(按视图视图标签字母顺序排列),以及它们是尺寸还是测量:

在“使用”标签中,选定了“利润总额”“订单项目费用”“订单项目数”和“订单创建日期”自定义字段。

使用中标签页也会在其底部显示更新后的“探索”摘要。左下角会显示“探索”中有效字段的总数。拥有 see_lookml 权限的用户可以在右下角使用 Go to LookML 链接。前往 LookML 会将用户定向到其 LookML 项目中的 explore 定义。上面的示例显示“探索”中目前共有四个活动字段。

从“正在使用”标签页中移除字段

如果某个字段正在使用中,您可以从字段选择器中选择该字段的名称,将其从探索中移除。

您还可以选择全部清除来移除所有已选字段(包括自定义字段和表格计算);选择清除字段,保留过滤条件,可移除所有字段(包括自定义字段和表格计算结果),当前所用过滤条件除外。这两个选项都不会移除自定义过滤条件;要移除自定义过滤条件,您需要手动取消选中相应过滤条件旁边的复选框。

或者,您也可以在正在使用标签页中选择相应的字段图标,选择过滤、数据透视或执行其他特定字段的操作

在“使用”标签页字段特定的图标和操作中

在“探索”查询中,每个字段旁边的图标表示字段的当前函数和潜在函数。在探索中使用时,自定义字段表计算会列在自定义字段视图标签下。拥有 create_table_calculations 权限的用户可以创建和修改表计算;拥有 create_custom_fields 权限的用户可以创建和修改自定义字段,方法是选择添加按钮,或从字段的三点状更多菜单中选择一个自定义字段选项。

用户必须拥有 create_table_calculationscreate_custom_fields 权限才能查看三点状更多菜单。唯一的例外是“正在使用”标签页中的维度组。“正在使用”标签页中的维度组会显示三点状的“更多”菜单。

当“探索”数据表格中的某个维度组处于有效状态时,用户可以使用三点状更多菜单访问切换到列表,将所选时间范围替换为其他时间范围(如果有),而无需手动取消选择某个字段,然后再选择其他字段:

切换到“订单创建日期”菜单,显示月份、季度、周、时间和年份时间范围选项。

当您从切换到列表中选择新的时间范围后,“探索”工具会自动重新运行并显示更新后的结果。使用切换到功能时,系统只会替换“探索数据”表中的时间范围,而不是过滤后的时间范围。

借助搜索功能,您可以快速选择构建探索所需的特定字段。

在搜索栏中输入字符串将过滤字段选择器,以便仅显示说明与搜索字符串完全匹配或部分匹配的字段、视图和字段。

要进行搜索,请先输入一个字词。您也可以选择搜索选项链接,选择限制搜索的选项:

  • 不限 - 选择此选项可在字段选择器中自由搜索您输入的字词。对于字段不超过 5,000 个的探索,这是默认选项。

  • 字段标签 - 选择此选项可将字段选择器限制为仅搜索字段名称。对于字段超过 5,000 个的探索,这是默认选项。

  • 字段说明 - 选择此选项可将字段选择器限制为仅搜索字段说明。

  • 维度组 - 选择此选项可将字段选择器限制为仅搜索维度组。

  • 视图名称 - 选择此选项可将字段选择器限制为仅搜索视图名称。

过滤字段选择器的功能与所有字段标签页部分中所述的相同。

移除字段

如需从探索中移除字段,请执行以下操作:

  1. 在字段选择器中选择所需的字段,或者从“探索数据”表格中列的齿轮菜单中选择移除
  2. 选择运行按钮以重新运行查询。

您也可以使用键盘快捷键 Command-K (Mac) 或 Ctrl+K (Windows) 移除“探索”中的所有字段。

对数据进行排序

“探索”部分中的某些排序是在客户端(用户的浏览器中)执行的,以减少数据库的往返调用次数,这样既昂贵又耗时。但是,此行为可能会导致“探索”结果与其他 Looker 内容不一致,因为在客户端和数据库之间排序可能会产生不同的结果,尤其是在系统语言区域不同时。

默认情况下,探索页面上的非透视数据会按以下优先级排序:

  1. 第一个日期维度(降序)
  2. 如果不存在日期维度,第一个测量(降序)
  3. 如果不存在测量,则添加的第一个维度(升序)

如需了解如何对透视数据进行排序,请参阅透视和排序部分。

字段的排序顺序在数据表中以以下几种方式表示:

  • 字段名称旁边有一个数字,用于区分该字段与其他字段的排序顺序
  • 字段名称旁边有一个表示排序方向的箭头(向上指升序,向下指降序)
  • 将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口

您可能需要以不同于默认顺序的方式对数据进行排序。您可以通过在数据表中选择一个字段名称来排序,并按该字段对查询进行排序:

  • 选择一次字段名称,即可按字段降序排序。
  • 选择字段名称两次,即可按升序对该字段进行排序。

您可以根据需要多次选择某个字段,以获得所需的排序顺序。

例如,包含订单创建日期用户状态订单计数的“探索”查询目前按订单创建日期降序排序。

但是,您想要查看回头客(即未进行首次购买的客户)订单最多的日期。选择订单商品数量列标题,以重新对查询进行排序,以显示订单数量从多到少的日期。订单商品计数旁边的向下箭头表示结果现在按此字段按降序排序。此外,当您将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口来确认排序顺序:

“订单商品数量”字段名称上的弹出式窗口,显示“降序”,排序顺序:1.

按多个字段排序

要对多个字段进行排序,请按住 Shift 键,然后按所需的顺序选择列标题。

探索查询,其中包含“订单创建日期”“用户状态”和“订单计数”字段(按“订单数量”降序排列,“订单创建日期”降序排列)。

订单创建日期订单商品数量字段名称旁边的箭头表示该表格已同时按这两个字段以及表格的排序顺序进行排序。Orders Created Date(订单创建日期)是第二个排序依据字段(降序),如向下箭头和字段名称旁边的 2 所示。

您还可以使用 case 参数创建自定义排序。

数据透视尺寸

水平透视其中一个维度时,多维度通常会更容易看清。维度中的每个值都将成为 Look 中的一列。这使得信息更易于查看,并且无需向下滚动即可查找数据。Looker 最多支持 200 个透视值。

若要按维度透视“探索”结果,请执行以下操作:

  1. 将鼠标悬停在字段选择器中的维度上,然后选择透视数据图标
  2. 选择运行以重新运行查询。
  3. 您可以通过以下两种方式之一逆透视字段:
    • 从数据表中列顶部的字段齿轮图标菜单中选择逆透视选项
    • 在字段选择器中再次选择该维度的透视数据图标

数据透视和 null

如果某行数据不会在列中出现,则用 null 值符号(表示零值,中间有一条斜线)表示该行。例如,在 12 月 21 日,没有已完成的订单:

使用按已取消和完成的订单状态字段值透视的订单创建日期和订单数探索查询。

数据透视和排序

您也可以在数据表中选择维度的标题,对透视维度进行排序。若要按多个透视维度进行排序,请按住 Shift 键,然后按所需的排序顺序选择维度标题。对透视测量进行排序时,系统会首先对该列中包含值的所有行进行排序,然后再对该列中没有数据的行进行排序(以 null 值符号表示)。

您还可以使用 case 参数创建自定义排序。

对列重新排序

您可以对数据部分中的列进行重新排序,只需选择列标题,然后将该列拖放到所需位置即可。选择运行按钮后,探索的可视化图表将反映新的列顺序。

数据部分按字段类型整理各列:

  1. 维度
  2. 维度表计算
  3. 测量
  4. 衡量表计算
  5. 行总计

在大多数情况下,可以在每个字段类型中对列重新排序,但无法将其移出其字段类型部分。

例如,维度表计算可以重新排列,但不能将维度表计算放在两个测量之间。

但有一种例外情况,那就是您可以使用数据标签页中“行总计”复选框旁边的箭头,将“行总计”列从数据表格最右侧移到维度表格计算之后。

可对透视维度下的列进行重新排序,但只能通过更改排列顺序(而不能通过手动重新排序)更改透视维度的顺序。

显示总计

有时,数据摘要会非常有用。您可以向“探索”查询中添加列总计,只需选中“探索”数据表格右上角的总计复选框,然后重新生成报告即可。

如果“探索”查询包含多个维度,您可以选择在可视化图表中包含小计,方法是选中“探索”数据表格右上角的小计复选框,并选中总计复选框。仅当您的查询包含多个维度时,小计复选框才会显示。

您还可以选中数据表右上角的行总计复选框,向透视的“探索”查询添加行总计。仅当“探索”查询包含透视维度时,行总计复选框才可用。

如果您添加了行总计,而您的查询超出了您设置的任何行数上限,您将无法对“行总计”列进行排序(但您可以照常对维度和列进行排序)。这是因为数据中可能缺少应计入总计值的行。如果遇到此问题,可以尝试提高查询的行数上限(最多 5,000 行)。

无法提供总计数据时

在以下几种情况下,系统不会提供总计数据:

  • 列总计仅适用于仅引用测量的测量和表格计算,不适用于引用维度的维度或表格计算。
  • 行总计仅适用于测量,而不适用于基于维度或维度的表计算。
  • 由于数据库限制或该值作为总计没有意义,因此系统不会对某些类型的列进行总计。例如,您无法将字词列表相加。

关于总计数据的注意事项

此外,关于总计值在特定情况下的运作方式,还需要注意以下几点:

  • 统计唯一项数的列可能不会按预期加总,因为相同的项可能显示在多个类别中,但在总计中只计为一个唯一项。
  • 行总计功能会创建一个额外的查询,此查询的行数上限为 30,000 行。如果您的“探索”查询超过 30,000 行,则系统只会显示前 30,000 行的行总计。此外,如果数据是透视的,那么行总数上限会因数据透视中的选项数量而进一步降低。
  • 某些执行聚合的表计算(例如使用 percentilemedian 的计算)的加总可能与您的预期不符。这是因为表格计算使用“总计”行中的值(而非数据列中的值)来计算总计。有关问题排查提示,请参阅将可能造成混淆的表格计算总数显示为 null 的“最佳做法”页面。
  • 如果您按衡量指标过滤报告,则总计值可能会过高。但实际上,您看到的是在应用衡量过滤器之前的数据总计。换言之,衡量过滤器可能会隐藏报告中的部分数据,尽管这些数据包含在总计中。
  • 如果您已将总计值与合并结果结合使用,Looker 会计算每个组成部分查询的总计值,并在合并结果中使用这些总计值。因此,显示的总数可能过高,这是因为您看到的是在结果合并之前计算出的总计数据。避免这种情况的一种方法是,针对每个查询对齐过滤器。
  • 同样,如果您在报告中设置了行或列限制,而报告超出该限制,则总计值可能也会显得过高。不过,您看到的是系统在应用限制之前的数据总计。换言之,这些上限可能会使报告中的部分数据被隐藏,即使这些数据包含在总计中。

在上述列表中的第 3 和第 4 个项目符号中描述的情况,可以只计算您所看到的数据的总计。为此,您需要使用表格计算,本页后面会对此进行介绍。对于列总计,请使用 sum(${view_name.field_name})。对于行总计,请使用 sum(pivot_row(${view_name.field_name}))

“探索”查询的费用估算值

对于 BigQueryMySQLAmazon RDS for MySQLSnowflakeAmazon RedshiftAmazon AuroraPostgreSQL、Cloud SQL for PostgreSQL 和 Microsoft Azure PostgreSQL连接,“探索”页面会提供查询的估算费用。从字段选择器中选择一个或多个字段,不要立即运行查询。“探索”页面会计算查询所需的数据量,并在运行按钮旁边显示相应信息。

在“探索”的“运行”按钮下的查询时区旁边,将显示 56.0 KB 的文本。

“探索”页面会根据查询显示不同的信息:

  • 对于数据库上的新查询,“探索”页面会显示将处理的字节数。
  • 对于可以从缓存中提取的查询,“探索”页面会显示将从缓存中提取的行数。
  • 对于使用聚合感知优化的查询,“探索”页面会显示使用聚合感知时将处理的字节数和将节省的字节数。

费用估算值的计算方法因方言而异。使用 Looker 的 EXPLAIN 函数来查看数据库如何处理查询。

面向开发者的功能

根据您的权限,您可能会在“探索”字段选择器中看到多项专为 Looker 开发者设计的功能:

  • 借助所有字段正在使用标签页中的前往 LookML 选项,开发者可以导航到探索的 LookML。
  • 通过字段的信息图标菜单中的 sql 参数定义,开发者无需转到字段的 LookML 即可查看字段的 sql 定义。
  • 通过字段的 Info 图标菜单中的 Go to LookML 选项,开发者可以查看该字段的 LookML。

在“探索”的数据表格齿轮菜单中,您可能还会在各字段和探索操作齿轮菜单中看到多项功能:

  • 通过字段的数据表齿轮菜单中的前往 LookML 选项,Looker 开发者可以前往该字段的 LookML 定义。
  • 通过“探索”的数据部分的 SQL 标签页,Looker 开发者可以查看 Looker 为检索数据而发送到数据库的 SQL 查询
  • 借助探索操作齿轮菜单中的获取 LookML 选项,开发者可以复制探索查询的 LookML,这可用于将功能块添加到 LookML 信息中心,通过汇总表提升查询性能,或定义原生派生表

总结

现在,您已了解 Looker 探索页面在构建查询、显示结果和通过迭代搜索发掘数据洞见方面的强大功能,建议您了解如何执行以下操作: