创建和修改探索

本页介绍了如何使用 Looker 进行数据探索。请阅读以下部分,了解这些 Looker 概念:

如需详细了解“探索”页面上的组件以及如何与“探索”数据互动,请访问查看和与探索互动文档页面。

探索是探索的起点

探索是用于探索特定主题领域的查询的起点。如需打开探索菜单,请从主导航面板中选择探索选项。

探索菜单会显示一些描述性的模型或组名称,这些名称按字母顺序排列。在探索菜单中,您可以搜索和选择探索,这些探索会按所属的模型或群组名称按字母顺序排列。

例如,如果您经营的是电子商务商店,则可以使用探索菜单查找包含探索的模型或组,以便查看电子商务商店数据。

您可以通过在探索菜单中展开或收起模型或组名称,来显示探索列表。您可以选择探索的名称来打开探索页面。

例如,A 电子商务商店模型包含“探索”订单项(与订单关联的商品)、订单(购买事件)、商品(库存商品的相关信息)和用户(与购买事件相关联的个人)。如果您对与订单关联的商品有疑问,不妨选择订单商品部分进行探索。

探索包含视图,即维度和测量的分组。“探索”中显示的数据取决于您从左侧字段选择器中列出的视图中选择的维度和测量。维度可视为数据的组或分桶。测量是指与该数据分桶相关的信息。在“探索”数据表中,维度显示为蓝色列,测量结果显示为橙色列。

例如,如需显示每天下单的数量,用户可以在“订单项”探索的“订单”视图中选择维度“创建日期”和测量值“数量”。

如果探索包含根据模型生成的查询,您可以使用“快速入门”分析来填充字段。下一部分将深入介绍“快速入门”分析,以及如何将其用作探索数据的起点。

快速入门分析

基于模型的查询作为“探索”中的快速入门分析选项提供。快速开始分析提供了一个有用的起点,可帮助您快速运行和构建分析。

快速入门分析卡片会显示在空白“探索”页面中字段选择器的右侧。每张“快速入门”分析卡片都会显示分析的名称和说明(如果有)。

如需详细了解开发者如何为用户建模预构建分析,请参阅 query 参数文档页面。

从空白探索中选择“快速开始”选项

如需运行快速入门分析,请选择要探索的分析选项。系统会自动运行查询并显示结果,包括可视化结果。

快速入门分析运行后,您可以通过在所有字段标签页、搜索结果或字段选择器正在使用标签页中添加移除字段来修改该分析。

在探索运行后选择“快速开始”选项

探索运行完毕后,您可以选择新的“快速入门”分析,方法是选择探索名称旁边的快速入门闪电图标。

选择此图标会打开快速入门菜单,其中会显示可用的分析卡片。

从菜单中选择某项快速入门分析后,系统会运行该分析,并替换除现有过滤条件之外的所有之前的探索结果。

“快速开始”过滤器行为

过滤条件是累加的。这意味着,快速入门分析在运行时将包含所有现有的“探索”过滤条件。如果所选的“快速入门”分析的过滤条件值与现有“探索”过滤条件冲突,系统会提示您选择要在分析中使用的过滤条件值。

例如,您目前正在查看包含以下过滤条件的“探索”查询的结果:

  • Orders Created Date(订单创建日期)为“2019”年。
  • 订单状态等于“已完成”。
  • 用户所在的州为“华盛顿”。

您想选择一个名为“按月统计加利福尼亚州的订单数”的新快速入门分析,该分析将按月份显示 2019 年在加利福尼亚州下达的订单数。

您选择 Quick Start(快速入门)闪电图标以打开“Quick Start”菜单,然后选择 CA order count by month(按月统计 CA 订单数)分析选项:

按月统计的 CA 订单数分析的用户所在的州/省/直辖市过滤条件值存在冲突。系统随即会打开选择过滤条件组菜单,并提示您选择保留当前过滤条件选项(列出当前过滤条件值)或替换为新过滤条件选项(列出所选“快速入门”分析的过滤条件值)来解决冲突。

如需在选择过滤条件组菜单中解决冲突,请按以下步骤操作:

  1. 选择相应选项。
    • 选择保留当前过滤条件,以使用现有过滤条件值(在本例中,用户所在的州为“华盛顿”)运行新的分析。
    • 选择替换为新过滤条件,以使用预构建的过滤条件(在本例中,用户所在的州等于“加利福尼亚州”)运行新的分析。
  2. 选择应用以确认选择并运行分析。

探索会使用更新后的“用户所在的州/省/直辖市/自治区”等于“加利福尼亚州”过滤条件运行,并且包含所有现有的不冲突的过滤条件(“订单创建日期”在 2019 年,且“订单状态”等于“已完成”)。

添加更多维度以获取更多详细信息

无论您是手动向“探索”添加字段,还是通过选择快速开始选项添加字段,都可以添加更多维度,以便详细了解您的数据。

如需添加字段,请按以下步骤操作:

  1. 字段选择器中选择一个字段,将其添加到查询中。
  2. 选择运行按钮以重新运行查询。

例如,如果您在包含订单创建日期订单数量的探索中选择订单状态维度,系统会按天显示状态为“已完成”“待处理”或“已取消”的订单数量。

字段选择器

字段选择器位于“探索”页面的左侧,从上到下包含以下元素:

  1. “探索”名称会显示当前“探索”的名称。快速入门闪电图标也会显示在包含模型化查询的探索中,以便您在探索运行后访问快速入门分析选项。
  2. 借助查找字段搜索栏,用户可以搜索与特定字词和条件匹配的字段。
  3. 所有字段标签页会显示探索的所有可用字段。
  4. 正在使用标签页会显示当前正在使用的所有“探索”字段。
  5. 视图级摘要会显示视图中所选字段的总数。此数字会在视图收起和展开时显示。
  6. 特定于字段的信息和操作图标会显示“探索”查询中字段的当前和潜在功能,以及字段的更多详细信息。

  7. “探索”摘要会在左下角显示“探索”中的字段总数(包括自定义字段和表计算,前提是权限允许),并在右下角显示前往 LookML 链接。转到 LookML 会将用户定向至其 LookML 项目中的 explore 定义。只有具有 see_lookml 权限的用户才能看到此链接。

特定字段的信息和操作

每个字段旁边的图标会提供有关该字段的更多信息,并指明该字段的可用选项。将光标悬停在字段上时,这些图标会显示出来。

您可以选择相应图标,根据字段的数据类型对包含该字段的查询进行多项更改,包括按字段进行过滤或转换。您还可以使用图标来显示字段的相关信息,或者在权限允许的情况下,根据该字段创建自定义字段。

这些图标会显示在所有字段正在使用标签页中。

可用的图标和功能包括:

  1. 对数据进行透视图标 - 选择此图标可在探索中对某个字段进行透视或取消透视。当字段未转换为数据透视表时,此图标会显示为灰色;当字段转换为数据透视表时,此图标会显示为粗体。
  2. 按字段过滤图标 - 选择此图标可按字段过滤查询结果,或移除某个字段作为过滤条件。如果某个字段不是有效的过滤条件,此图标将显示为灰色;如果是有效的过滤条件,则显示为粗体。

  3. 信息图标 info - 选择此图标可打开弹出式窗口,详细了解某个字段:

    • 该弹出式窗口将向所有用户显示字段的数据类型、说明(如果有)和 LookML 字段名称(采用 view_name.field_name 语法)。
    • 对于具有 see_lookml 权限的用户,该弹出式窗口将包含 LookML 字段的 sql 参数的定义,以及用于在 LookML 项目中导航到该字段的链接。

  4. 在某些情况下,用户可以使用三点状更多菜单

    具有 create_custom_fields 权限的用户可以使用三点状 More 菜单,根据字段的类型快速创建自定义字段

“所有字段”标签页

打开现有探索时,系统会默认显示所有字段标签页。此标签页是构建“探索”的起点,其中会显示您可用于查询的所有可用字段。字段会按类型(维度,后跟测量)以字母数字排序,并显示在定义它们的视图视图标签的名称下。每个字段都会显示特定于字段的信息和操作,例如字段在“探索”查询中的当前和潜在用途。

“所有字段”标签页,其中光标悬停在“利润”维度上。

在查询中选择的字段将以灰色背景突出显示,相应的字段图标(数据透视表、过滤条件)将以粗体显示,您无需将光标悬停在字段上,即可在字段处于活动状态时看到这些图标。例如,上例中字段选择器中的 Profit 字段以灰色突出显示,表示它已被选中。您可以判断此字段未经过数据透视或过滤,因为所有对应的字段图标均未加粗,并且在您未将鼠标悬停在字段上时不会显示。

所有字段标签页中选择一个字段,将其添加到“探索”查询或从中移除。此外,您还可以从所有字段标签页中选择相应的字段图标,以执行过滤、转换或其他特定于字段的操作

自定义字段表格计算列在自定义字段视图标签下。拥有 create_table_calculations 权限的用户可以创建和修改表格计算,拥有 create_custom_fields 权限的用户可以通过选择视图标签旁边的添加按钮,或从字段的三点状 更多菜单中选择自定义字段选项,来创建和修改自定义字段。

在“使用”标签页中

“正在使用”标签页会显示“探索”中当前有效的所有字段,这些字段会按视图视图标签以及它们是维度还是指标进行字母数字排序:

“使用”标签页中显示了所选的自定义字段“利润总计”“订单项费用”“订单项数量”和“订单创建日期”。

正在使用标签页底部还会显示更新后的“探索”摘要。左下角会显示“探索”中的有效字段总数。右下角会显示一个前往 LookML 链接,供拥有 see_lookml 权限的用户使用。转到 LookML 会将用户定向至其 LookML 项目中的 explore 定义。上例显示“探索”中目前有四个有效字段。

从“正在使用”标签页中移除字段

当某个字段正在使用时,您可以从字段选择器中选择该字段的名称,将其从“探索”中移除。

您还可以选择全部清除来移除所有所选字段(包括自定义字段和表格计算字段),也可以选择清除字段,保留过滤条件来移除所有字段(包括自定义字段和表格计算字段),但活跃过滤条件除外。这两个选项都不会移除自定义过滤条件;如需移除自定义过滤条件,您需要手动取消选中相应过滤条件旁边的复选框。

或者,您也可以选择在正在使用标签页中选择相应的字段图标,以执行过滤、转换或其他特定于字段的操作

在“使用”标签页中,使用特定于字段的图标和操作

每个字段旁边的图标表示该字段在“探索”查询中的当前和潜在用途。当自定义字段表格计算在探索中使用时,会列在自定义字段视图标签下。拥有 create_table_calculations 权限的用户可以创建和修改表格计算,拥有 create_custom_fields 权限的用户可以通过选择添加按钮或从字段的三点状图标 更多菜单中选择自定义字段选项来创建和修改自定义字段。

用户必须拥有 create_table_calculationscreate_custom_fields 权限,才能看到三点状 更多菜单。唯一的例外是正在使用标签页中的维度组 - 正在使用标签页中显示的维度组会显示三点状图标 更多菜单。

当某个维度组在“探索”的数据表格中处于活动状态时,用户可以使用三点状图标 More 菜单访问 Switch to 列表,以将所选时间范围替换为另一个时间范围(如果有),而无需手动取消选择一个字段并选择另一个字段:

切换到“订单创建日期”菜单,其中显示了“月”“季度”“周”“时间”和“年”时间范围选项。

当您从切换到列表中选择新的时间范围后,“探索”功能会自动重新运行,并显示更新后的结果。使用切换到函数时,系统只会替换“探索数据”表格中的时间范围,而不会替换过滤后的时间范围。

借助搜索功能,您可以快速选择构建探索所需的特定字段。

在搜索栏中输入字符串后,字段选择器会进行过滤,仅显示与搜索字符串的全部或部分内容匹配的字段、视图和字段说明。

如需执行搜索,请先输入一个字词。您还可以选择搜索选项链接,选择用于限制搜索范围的选项:

  • 任意 - 选择此选项可在字段选择器中搜索您输入的字词,不受限制。这是包含 5,000 个字段或更少字段的探索的默认值。

  • 字段标签 - 选择此选项可将字段选择器的搜索范围限制为字段名称。这是包含 5,000 多个字段的探索的默认值。

  • 字段说明 - 选择此选项可将字段选择器搜索范围限制为字段说明。

  • 维度组 - 选择此选项可将字段选择器的搜索范围限制为维度组。

  • View Name(视图名称)- 选择此选项可将字段选择器搜索范围限制为视图名称。

过滤后的字段选择器的功能与“所有字段”标签页部分中所述的功能相同。

移除字段

如需从探索中移除字段,请执行以下操作:

  1. 在字段选择器中选择所需字段,或在“探索数据”表格中从列的齿轮菜单中选择移除
  2. 选择运行按钮以重新运行查询。

您也可以使用键盘快捷键 Command-K (Mac) 或 Ctrl+K (Windows) 移除探索中的所有字段。

对数据进行排序

探索中的部分排序是在客户端(用户的浏览器中)执行的,以减少对数据库的往返调用次数,这可能会花费大量时间和成本。不过,这种行为可能会导致“探索”结果与其他 Looker 内容之间不一致,因为客户端和数据库之间的排序可能会产生不同的结果,尤其是在系统语言区域不同的情况下。

探索页面上的非透视数据默认会按以下优先级排序:

  1. 第一个日期维度,降序
  2. 如果不存在日期维度,则为第一个测量值,降序
  3. 如果不存在衡量标准,则为第一个添加的维度,按升序排列

如需了解如何对汇总数据进行排序,请参阅数据透视表和排序部分。

数据表中会以多种方式显示字段的排序方式:

  • 字段名称旁边会显示一个数字,用于区分其与其他字段的排序顺序
  • 字段名称旁边带有箭头,指示排序方向(向上箭头表示升序,向下箭头表示降序)
  • 当您将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口

您可能希望以与默认顺序不同的方式对数据进行排序。您可以选择数据表格中的字段名称,按该字段对查询进行排序:

  • 选择字段名称一次,即可按该字段降序排序。
  • 选择某个字段名称两次,即可按升序对该字段进行排序。

您可以根据需要多次选择某个字段,以获得所需的排序顺序。

例如,包含订单创建日期用户状态订单数量的“探索”查询目前按订单创建日期降序排序。

不过,您想查看回头客(即不是首次购买的客户)下单最多的日期。选择Order Items Count(订单项数量)列标题,重新对查询进行排序,以按订单数量从高到低的顺序显示日期。Order Items Count 旁边的向下箭头表示结果现在按此字段降序排列。此外,当您将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口来确认排序顺序:

在“Order Items Count”(订单项数量)字段名称上方显示的弹出式窗口,其中显示了“降序”“排序顺序:1”文本。

按多个字段排序

如需对多个字段进行排序,请按住 Shift 键,然后按照所需排序顺序选择列标题。

探索查询,其中“订单创建日期”“用户状态”和“订单数量”字段按“订单数量”和“订单创建日期”降序排序。

Orders Created DateOrder Items Count 字段名称旁边的箭头表示表格按这两个字段进行排序,以及排序的顺序。Orders Created Date(订单创建日期)是第二个排序字段(降序),如字段名称旁边的向下箭头和 2 所示。

您还可以使用 case 参数创建自定义排序。

对维度进行透视

如果有多个维度,您可以对其中一个维度进行水平透视,这样可以更轻松地查看这些维度。在 Look 中,该维度中的每个值都会自成一列,便于您轻松了解相关信息,而不必向下滚动查找数据。Looker 支持多达 200 个透视值。

如需按维度对“探索”结果进行透视,请执行以下操作:

  1. 将光标悬停在字段选择器中的维度上,然后选择数据透视图图标
  2. 选择运行以重新运行查询。
  3. 您可以通过以下两种方式之一取消转换字段:
    • 从数据表格中相应列顶部的字段齿轮图标菜单中选择取消转置选项
    • 在字段选择器中再次选择维度的汇总数据图标

数据透视和 null

如果某一列的数据行没有可显示的值,系统会显示 null 值符号(有斜杠划过的零)。例如,12 月 21 日没有任何已完成的订单:

探索查询,其中“订单创建日期”和“订单数量”按“订单状态”字段值“已取消”和“已完成”进行分屏。

数据透视和排序

您也可以在数据表格中选择维度标题,对透视维度进行排序。如需按多个透视维度排序,请按住 Shift 键,然后按照所需排序顺序选择各个维度标题。对透视测量进行排序时,系统会先依序列出该列中有值的行,再列出没有值的行(以 null 值符号表示)。

您还可以使用 case 参数创建自定义排序。

对列重新排序

您可以在数据部分中选择某个列标题,再将该列拖放到所需位置,以对列重新排序。选择运行按钮后,探索的可视化图表就会按新的顺序显示各列。

数据部分,系统会按以下字段类型整理各列:

  1. 维度
  2. 维度表计算
  3. 测量
  4. 衡量表计算
  5. 行总计

通常,您可以在各个字段类型内对列重新排序,但无法将其移出所属的字段类型部分。

例如,您可以将各个维度表计算重新排序,但无法将某个维度表计算放在两个测量之间。

不过有个情况例外,在数据标签页中,您可以使用行总计复选框旁边的箭头,将行总计列从数据表的最右侧,移动到维度表计算后面。

您可以将透视维度下的列重新排序,但只能通过更改排列顺序来更改透视维度的顺序,而无法通过手动重新排序来更改。

显示总计

有时,数据摘要会很有用。如需向探索查询添加列总计,请选中“探索”数据表右上角的总计复选框,然后重新运行查询。

如果“探索”查询包含多个维度,您可以选择在表格可视化中添加小计,方法是选中“探索”数据表右上角“总计”复选框旁边的小计复选框。只有当查询包含多个维度时,小计复选框才会显示。

您还可以通过选中数据表右上角的行总计复选框,向数据透视探索查询添加行总计。只有当“探索”查询包含数据透视维度时,行总计复选框才可用。

如果您添加了行总计,并且查询超出了您设置的任何行数限制,则将无法对行总计列进行排序(但您可以照常对维度列和测量列进行排序)。这是因为您的数据中可能缺少应包含在总计中的行。如果您遇到此问题,可以尝试提高查询的行数限制(最多 5,000 行)。

总计数据不可用的情况

在某些情况下,系统不会显示总计:

  • 列总计仅适用于仅引用测量的测量和表计算,而不适用于引用维度的维度或表计算。
  • 行总计仅适用于测量,而不适用于基于维度或维度表计算的表计算。
  • 某些类型的列不会进行求和,这是由于数据库限制或值作为总和没有意义。例如,您无法对字词列表进行求和。

关于总计的注意事项

此外,请注意总计在某些情况下的运作方式:

  • 用于统计唯一项的列的总和可能不符合您的预期,因为同一项可能出现在多个类别中,但在总计中只会计为一个唯一项。
  • 行总计功能会创建一个额外的查询,而此查询的行数上限为 3 万行。如果您的“探索”查询包含的行数超过 3 万行,则系统只会显示前 3 万行的行总计。此外,如果数据经过数据透视,行总计限制还会因数据透视中的选项数量而进一步减少。
  • 执行汇总的某些表计算(例如使用 percentilemedian 的计算)的总和可能不符合您的预期。这是因为表计算是使用总计行中的值(而非数据列中的值)来计算总计的。如需查看问题排查提示,请参阅将可能造成混淆的表格计算总和显示为 null 最佳实践页面。
  • 如果您按指标过滤了查询,总计数可能会看起来过高。但实际上,您看到的是应用衡量标准过滤器之前的数据总和。换句话说,衡量标准过滤条件可能会隐藏查询结果中的某些数据,即使这些数据包含在总计中也是如此。
  • 如果您在合并的结果中使用了总计,Looker 会针对每个组成部分查询计算总计,并在合并的结果中使用这些总计。因此,总数可能会看起来过高,因为您看到的是合并结果之前计算的总数。避免出现这种情况的一种方法是使每个查询的过滤条件对齐。
  • 同样,如果您对查询设置了行或列限制,而查询结果超出了该限制,总计值也可能会过高。不过,您看到的是应用限制之前的数据总和。换句话说,这些限制可能会隐藏查询结果中的部分数据,即使这些数据包含在总数中也是如此。

在前面列表中的第三点和第四点所述的情况下,您可以针对您可以看到的数据计算总计。为此,您需要使用表格计算功能(本页稍后会介绍)。对于列总计,请使用 sum(${view_name.field_name})。对于行总计,请使用 sum(pivot_row(${view_name.field_name}))

“探索”查询的费用估算值

对于 BigQueryMySQLAmazon RDS for MySQLSnowflakeAmazon RedshiftAmazon AuroraPostgreSQL、Cloud SQL for PostgreSQL 和 Microsoft Azure PostgreSQL 连接,探索页面会提供查询费用的估算值。从字段选择器中选择一个或多个字段,然后不要立即运行查询。“探索”页面会计算查询所需的数据量,并在运行按钮附近显示相关信息。

“探索”的“运行”按钮下方,查询时区旁边显示“将处理 56.0 KB”文本。

“探索”页面会根据查询显示不同的信息:

  • 对于对数据库的新查询,“探索”页面会显示将要处理的字节数。
  • 对于可从缓存中提取的查询,探索页面会显示将从缓存中提取的行数。
  • 对于使用汇总感知优化的查询,探索页面会显示将要处理的字节数以及使用汇总感知功能可节省的字节数。

费用估算的计算方法因方言而异。使用 Looker 的 EXPLAIN 函数查看数据库如何处理查询。

面向开发者的功能

您可能会在“探索”字段选择器中看到一些专为 Looker 开发者设计的功能,具体取决于您的权限

  • 通过所有字段正在使用标签页上的前往 LookML 选项,开发者可以前往“探索”的 LookML。
  • 借助字段的信息图标菜单中的 sql 参数定义,开发者无需转到字段的 LookML 即可查看字段的 sql 定义。
  • 通过字段的信息图标菜单中的 Go to LookML 选项,开发者可以查看字段的 LookML。

您还可以在“探索”的数据表格齿轮菜单(针对字段)和探索操作齿轮菜单中看到多项功能:

  • 通过字段数据表齿轮菜单中的 Go to LookML 选项,Looker 开发者可以前往字段的 LookML 定义。
  • 通过“探索”的数据部分中的 SQL 标签页,Looker 开发者可以查看 Looker 发送到数据库以检索数据的 SQL 查询
  • 借助“探索”操作齿轮菜单中的 Get LookML 选项,开发者可以为“探索”的查询复制 LookML,以便将功能块添加到 LookML 信息中心、使用汇总表提升查询性能,或定义原生派生表

探索查询跟踪器

如果“探索”可视化面板或数据面板处于打开状态,则在“探索”查询运行时,系统会显示“探索”查询跟踪器,以便您查看查询的进度。

总结

现在,您已经了解了 Looker 探索页面在构建查询、显示结果以及通过迭代搜索发现数据洞见方面的强大功能,接下来不妨了解如何执行以下操作: