创建和修改探索

本页面介绍了如何使用 Looker 进行数据探索。请阅读以下部分,了解这些 Looker 概念:

如需详细了解“探索”页面上的组件以及如何与“探索”数据互动,请访问查看和与探索互动文档页面。

探索是探索的起点

探索是查询的起点,用于探索特定主题领域。左侧导航面板中选择探索选项,以打开探索菜单。

探索菜单会显示一些描述性的模型或组名称,这些名称按字母顺序排列。在探索菜单中,您可以搜索和选择探索,这些探索会按所属的模型或群组名称按字母顺序排列。

例如,如果您经营一家电子商务商店,则可以使用探索菜单查找包含“探索”功能的模型或组,以便查看电子商务商店数据。

您可以通过展开或收起探索菜单中的模型或组名称来显示“探索”列表。选择“探索”的名称即可打开“探索”页面。

例如,“电子商务”商店模式包含“探索”“订单商品”(与订单关联的商品)、“订单”(购买事件)、“商品”(与商品目录商品相关的信息)和“用户”(与购买事件关联的个人)。如果您对与订单关联的商品有疑问,不妨选择订单商品“探索”工具。

探索包含视图,即维度和测量的分组。“探索”中显示的数据取决于您从左侧字段选择器中列出的视图中选择的维度和测量值。维度可以视为一组数据或一组数据。测量是指该数据分桶相关的信息。在“探索”数据表中,维度显示为蓝色列,测量显示为橙色列。

例如,如需显示每天下单的数量,用户可以在“订单项”探索的“订单”视图中选择维度“创建日期”和测量值“数量”。

如果探索包含根据模型生成的查询,您可以使用“快速入门”分析来填充字段。下一部分将深入介绍快速入门分析以及如何将其用作探索数据的切入点。

快速入门分析

基于模型的查询作为“探索”中的快速入门分析选项提供。“快速入门”分析是快速运行分析和建立分析的有用起点。

“快速入门”分析卡片显示在空白“探索”中的字段选择器右侧。每张“快速入门”分析卡片都会显示分析的名称和说明(如果有)。

如需详细了解开发者如何为用户构建预构建分析模型,请参阅 query 参数文档页面。

从空白探索中选择“快速开始”选项

如需运行快速入门分析,请选择要探索的分析选项。系统会自动运行查询并显示结果,包括可视化结果。

快速入门分析运行后,您可以通过以下方式对其进行修改:在所有字段标签页、搜索结果或字段选择器正在使用标签页中添加移除字段。

在探索运行后选择“快速开始”选项

探索运行完毕后,您可以选择“探索”名称旁边的快速入门闪电图标,选择新的“快速入门”分析。

选择此图标会打开快速入门菜单,其中会显示可用的分析卡片。

从菜单中选择某项快速入门分析后,系统会运行该分析,并替换除现有过滤条件之外的所有之前的探索结果。

“快速入门”过滤条件行为

过滤条件是累加的。也就是说,在运行“快速入门”分析时,它会包含任何现有的“探索”过滤条件。如果所选的“快速入门”分析的过滤条件值与现有“探索”过滤条件冲突,系统会提示您选择要在分析中使用的过滤条件值。

例如,您目前正在查看包含以下过滤条件的“探索”查询的结果:

  • Orders Created Date 为“2019”年份。
  • Orders Status 等于“complete”。
  • Users State(用户状态)为“Washington”。

您要选择一个名为“按月统计加利福尼亚州的订单数”的新快速入门分析,该分析将按月份显示 2019 年在加利福尼亚州下达的订单数。

选择快速入门闪电图标以打开“快速入门”菜单,然后选择 CA 每月订单计数分析选项:

“CA 订单数(按月)”分析中的“用户状态”过滤条件的过滤条件值存在冲突。系统随即会打开选择过滤条件组菜单,并提示您选择保留当前过滤条件选项(列出当前过滤条件值)或替换为新过滤条件选项(列出所选“快速入门”分析的过滤条件值)来解决冲突。

如需在选择过滤条件组菜单中解决冲突,请按以下步骤操作:

  1. 选择相应选项。
    • 选择保留当前过滤条件,以使用现有过滤条件值运行新的分析(在本例中,用户状态为“华盛顿州”)。
    • 选择替换为新过滤条件,以使用预构建的过滤条件(在本例中,用户所在的州等于“加利福尼亚州”)运行新的分析。
  2. 选择应用以确认选择并运行分析。

运行“探索”时,更新后的用户州/省为“California”(加利福尼亚州)过滤条件,并且包含所有现有的非冲突过滤条件(订单创建日期为“2019”年份,订单状态为“完成”)。

添加更多维度以获取更多详细信息

无论您是手动向“探索”添加字段,还是通过选择快速开始选项添加字段,都可以添加更多维度,以便详细了解您的数据。

如需添加字段,请按以下步骤操作:

  1. 字段选择器中选择一个字段,将其添加到查询中。
  2. 选择运行按钮以重新运行查询。

例如,如果您在包含订单创建日期订单数量的探索中选择订单状态维度,系统会按天显示状态为“已完成”“待处理”或“已取消”的订单数量。

字段选择器

字段选择器位于“探索”页面的左侧,从上到下包含以下元素:

  1. “探索”名称会显示当前“探索”的名称。如果探索包含根据模型估算的查询,系统也会显示快速入门闪电图标。通过该图标,您可以在“探索”功能运行后使用“快速入门”分析选项。
  2. 借助查找字段搜索栏,用户可以搜索与特定字词和条件匹配的字段。
  3. 所有字段标签页会显示探索的所有可用字段。
  4. 正在使用标签页会显示当前正在使用的所有“探索”字段。
  5. 视图级摘要会显示视图中所选字段的总数。此数字会在视图收起和展开时显示。
  6. 特定于字段的信息和操作图标会显示“探索”查询中字段的当前和潜在功能,以及字段的更多详细信息。

  7. “探索”摘要在左下角显示“探索”中的字段总数(在权限允许的情况下,包括自定义字段和表计算),并在右下角显示转到 LookML 链接。前往 LookML 会将用户定向到其 LookML 项目中的 explore 定义。只有拥有 see_lookml 权限的用户才能看到此链接。

特定于字段的信息和操作

每个字段旁边的图标会提供有关该字段的更多信息,并指明该字段的可用选项。将光标悬停在字段上时,这些图标会显示出来。

您可以选择相应图标,根据字段的数据类型对包含该字段的查询进行多项更改,包括按字段进行过滤或转换。您还可以使用图标来显示字段的相关信息,或者在权限允许的情况下,根据该字段创建自定义字段。

这些图标会显示在所有字段正在使用标签页中。

可用的图标和功能包括:

  1. 透视数据图标 - 选择此图标可在“探索”中对字段进行透视或逆透视。未透视字段时,此图标会显示为灰色;当字段进行透视时,此图标会显示为粗体。
  2. 按字段过滤图标 - 选择此图标可按字段过滤查询结果,或移除字段作为过滤条件。如果某个字段不是有效的过滤器,此图标会显示为灰色;如果是有效的过滤器,此图标会显示为粗体。

  3. 信息图标 info - 选择此图标可打开一个弹出式窗口,详细了解相应字段:

    • 该弹出式窗口将向所有用户显示字段的数据类型、说明(如果有)和 LookML 字段名称(采用 view_name.field_name 语法)。
    • 对于拥有 see_lookml 权限的用户,弹出式窗口将包含 LookML 字段的 sql 参数的定义,以及用于转到 LookML 项目中该字段的链接。

  4. 在某些情况下,用户可以看到三点状更多菜单

    拥有 create_custom_fields 权限的用户可以使用三点状更多菜单,根据字段类型快速创建自定义字段

“所有字段”标签页

打开现有探索时,系统会默认显示所有字段标签页。此标签页是构建探索的起点,其中显示了您可以为查询选择的所有可用字段。字段会按类型(维度,后跟测量)按字母顺序排列在定义它们的视图视图标签下。每个字段都会显示特定于字段的信息和操作,例如字段在“探索”查询中的当前和潜在用途。

“所有字段”标签页,其中光标悬停在“利润”维度上。

在查询中选择的字段会以灰色背景突出显示,对应的字段图标(数据透视、过滤器)将以粗体显示,而无需将指针悬停在某个字段处于活跃状态时。例如,上述字段选择器示例中的字段利润会突出显示为灰色,表示已选中该字段。您可以看出,此字段未进行透视或过滤,因为所有对应的字段图标都不是粗体,并且当您将鼠标悬停在该字段上时,图标不会显示。

所有字段标签页中选择一个字段,将其添加到“探索”查询或从中移除。此外,您还可以从所有字段标签页中选择相应的字段图标,以执行过滤、转换或其他特定于字段的操作

自定义字段表格计算列在自定义字段视图标签下。拥有 create_table_calculations 权限的用户可以创建和修改表计算;拥有 create_custom_fields 权限的用户可以创建和修改自定义字段,方法是选择视图标签旁边的添加按钮,或者从字段的三点状菜单更多菜单中选择自定义字段选项。

“使用中”标签页

“正在使用”标签页会显示“探索”中当前有效的所有字段,这些字段会按视图视图标签以及它们是维度还是指标进行字母数字排序:

“使用”标签页中显示了所选的自定义字段“利润总计”“订单项费用”“订单项数量”和“订单创建日期”。

使用中标签页也会在其底部显示更新后的“探索”摘要。左下角会显示“探索”中有效字段的总数。拥有 see_lookml 权限的用户可以在右下角使用 Go to LookML 链接。转到 LookML 会将用户定向至其 LookML 项目中的 explore 定义。上面的示例显示“探索”中目前共有四个活动字段。

从“正在使用”标签页中移除字段

如果某个字段正在使用中,您可以从字段选择器中选择该字段的名称,将其从探索中移除。

您还可以选择全部清除来移除所有所选字段(包括自定义字段和表格计算字段),也可以选择清除字段,保留过滤条件来移除所有字段(包括自定义字段和表格计算字段),但活跃过滤条件除外。这两个选项都不会移除自定义过滤条件;如需移除自定义过滤条件,您需要手动取消选中相应过滤条件旁边的复选框。

或者,您也可以在正在使用标签页中选择相应的字段图标,选择过滤、数据透视或执行其他特定字段的操作

在“使用”标签页中,使用特定于字段的图标和操作

在“探索”查询中,每个字段旁边的图标表示字段的当前函数和潜在函数。当自定义字段表格计算在探索中使用时,会列在自定义字段视图标签下。具有 create_table_calculations 权限的用户可以创建和修改表格计算,具有 create_custom_fields 权限的用户可以通过选择添加按钮或从字段的三点状图标 更多菜单中选择自定义字段选项来创建和修改自定义字段。

用户必须拥有 create_table_calculationscreate_custom_fields 权限,才能看到三点状 更多菜单。唯一的例外是正在使用标签页中的维度组 - 正在使用标签页中显示的维度组会显示三点状图标 更多菜单。

当某个维度组在“探索”的数据表格中处于活动状态时,用户可以使用三点状图标 More 菜单访问 Switch to 列表,以将所选时间范围替换为另一个时间范围(如果有),而无需手动取消选择一个字段并选择另一个字段:

切换到“订单创建日期”菜单,显示月份、季度、周、时间和年份时间范围选项。

当您从切换到列表中选择新的时间范围后,“探索”工具会自动重新运行并显示更新后的结果。使用切换到函数时,系统只会替换“探索数据”表格中的时间范围,而不会替换过滤后的时间范围。

借助搜索功能,您可以快速选择构建探索所需的特定字段。

在搜索栏中输入字符串后,字段选择器会进行过滤,仅显示与搜索字符串的全部或部分内容匹配的字段、视图和字段说明。

要进行搜索,请先输入一个字词。您还可以选择搜索选项链接,选择用于限制搜索范围的选项:

  • 任意 - 选择此选项可在字段选择器中搜索您输入的字词,不受限制。对于字段未超过 5,000 个的探索,这是默认选项。

  • 字段标签 - 选择此选项可将字段选择器限制为仅搜索字段名称。这是包含 5,000 多个字段的探索的默认选项。

  • 字段说明 - 选择此选项可将字段选择器搜索范围限制为字段说明。

  • 维度组 - 选择此选项可将字段选择器的搜索范围限制为维度组。

  • View Name(视图名称)- 选择此选项可将字段选择器的搜索范围限制为视图名称。

过滤字段选择器的功能与所有字段标签页部分中所述的相同。

移除字段

如需从探索中移除字段,请执行以下操作:

  1. 在字段选择器中选择所需的字段,或者从“探索数据”表格中列的齿轮菜单中选择移除
  2. 选择运行按钮以重新运行查询。

您也可以使用键盘快捷键 Command-K (Mac) 或 Ctrl+K (Windows) 移除探索中的所有字段。

对数据进行排序

探索中的部分排序是在客户端(用户的浏览器中)执行的,以减少对数据库的往返调用次数,这可能会花费大量时间和开销。不过,这种行为可能会导致“探索”结果与其他 Looker 内容之间不一致,因为客户端和数据库之间的排序可能会产生不同的结果,尤其是在系统语言区域不同的情况下。

探索页面上的非透视数据默认会按以下优先级排序:

  1. 第一个日期维度(降序)
  2. 如果不存在日期维度,第一个计量单位(降序)
  3. 如果不存在衡量标准,则为第一个添加的维度,按升序排列

如需了解如何对透视数据进行排序,请参阅透视和排序部分。

字段的排序顺序在数据表中以以下几种方式表示:

  • 字段名称旁边会显示一个数字,用于区分其与其他字段的排序顺序
  • 字段名称旁边有一个表示排序方向的箭头(向上指升序,向下指降序)
  • 将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口

您可能希望以与默认顺序不同的方式对数据进行排序。您可以选择数据表格中的字段名称,按该字段对查询进行排序:

  • 选择字段名称一次,即可按该字段降序排序。
  • 选择字段名称两次,即可按升序对该字段进行排序。

您可以根据需要多次选择某个字段,以获得所需的排序顺序。

例如,包含订单创建日期用户状态订单数量的“探索”查询目前按订单创建日期降序排序。

不过,您想查看回头客(即不是首次购买的客户)下单最多的日期。选择Order Items Count(订单项数量)列标题,重新对查询进行排序,以按订单数量从高到低的顺序显示日期。订单商品计数旁边的向下箭头表示结果现在按此字段按降序排序。此外,当您将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口来确认排序顺序:

“订单商品数量”字段名称的弹出式窗口,其中显示“降序”,排序顺序:1.

按多个字段排序

要对多个字段进行排序,请按住 Shift 键,然后按所需的顺序选择列标题。

探索查询,其中“订单创建日期”“用户状态”和“订单数量”字段按“订单数量”和“订单创建日期”降序排序。

Orders Created DateOrder Items Count 字段名称旁边的箭头表示表格按这两个字段进行排序,以及排序的顺序。Orders Created Date(订单创建日期)是第二个排序依据字段(降序),如向下箭头和字段名称旁边的 2 所示。

您还可以使用 case 参数创建自定义排序。

对维度进行透视

如果有多个维度,您可以对其中一个维度进行水平透视,这样可以更轻松地查看这些维度。在 Look 中,该维度中的每个值都会自成一列,便于您轻松了解相关信息,而不必向下滚动查找数据。Looker 支持多达 200 个透视值。

若要按维度透视“探索”结果,请执行以下操作:

  1. 将鼠标悬停在字段选择器中的维度上,然后选择透视数据图标
  2. 选择运行以重新运行查询。
  3. 您可以通过以下两种方式之一取消转换字段:
    • 从数据表格中相应列顶部的字段齿轮图标菜单中选择取消转置选项
    • 在字段选择器中再次选择该维度的透视数据图标

数据透视和 null

如果某一列的数据行没有可显示的值,系统会显示 null 值符号(有斜杠划过的零)。例如,12 月 21 日没有任何已完成的订单:

探索查询,其中“订单创建日期”和“订单数量”按“订单状态”字段值“已取消”和“已完成”进行分屏。

数据透视和排序

您也可以在数据表中选择维度的标题,对透视维度进行排序。若要按多个透视维度进行排序,请按住 Shift 键,然后按所需的排序顺序选择维度标题。对透视测量进行排序时,系统会首先对该列中包含值的所有行进行排序,然后再对该列中没有数据的行进行排序(以 null 值符号表示)。

您还可以使用 case 参数创建自定义排序。

对列重新排序

您可以对数据部分中的列进行重新排序,只需选择列标题,然后将该列拖放到所需位置即可。选择运行按钮后,探索的可视化图表就会按新的顺序显示各列。

数据部分按字段类型整理各列:

  1. 维度
  2. 维度表计算
  3. 测量
  4. 衡量表计算
  5. 行总计

通常,您可以在各个字段类型内对列重新排序,但无法将其移出所属的字段类型部分。

例如,您可以将各个维度表计算重新排序,但无法将某个维度表计算放在两个测量之间。

不过有个情况例外,在数据标签页中,您可以使用行总计复选框旁边的箭头,将行总计列从数据表的最右侧,移动到维度表计算后面。

您可以将透视维度下的列重新排序,但只能通过更改排列顺序来更改透视维度的顺序,而无法通过手动重新排序来更改。

显示总计

有时,数据摘要会非常有用。如需向探索查询添加列总计,请选中“探索”数据表右上角的总计复选框,然后重新运行查询。

如果“探索”查询包含多个维度,您可以选择在可视化图表中包含小计,方法是选中“探索”数据表格右上角的小计复选框,并选中总计复选框。只有当查询包含多个维度时,小计复选框才会显示。

您还可以选中数据表右上角的行总计复选框,向透视的“探索”查询添加行总计。只有当“探索”查询包含数据透视维度时,行总计复选框才可用。

如果您添加了行总计,而您的查询超出了您设置的任何行数上限,您将无法对“行总计”列进行排序(但您可以照常对维度和列进行排序)。这是因为数据中可能缺少应计入总计值的行。如果您遇到此问题,可以尝试提高查询的行数限制(最多 5,000 行)。

无法提供总计数据时

在以下几种情况下,系统不会提供总计数据:

  • 列总计仅适用于仅引用测量的测量和表格计算,不适用于引用维度的维度或表格计算。
  • 行总计仅适用于测量,而不适用于基于维度或维度的表计算。
  • 某些类型的列不会进行求和,这是由于数据库限制或值作为总和没有意义。例如,您无法对字词列表进行求和。

关于总计的注意事项

此外,请注意总计在某些情况下的运作方式:

  • 统计唯一项数的列可能不会按照您的预期加总,因为相同的项可能显示在多个类别中,但在总计中只计为一个唯一项。
  • 行总计功能会创建一个额外的查询,而此查询的行数上限为 3 万行。如果您的“探索”查询超过 30,000 行,则系统只会显示前 30,000 行的行总计。此外,如果数据经过数据透视,行总计限制还会因数据透视中的选项数量而进一步减少。
  • 执行汇总的某些表计算(例如使用 percentilemedian 的计算)的总和可能不符合您的预期。这是因为表格计算使用“总计”行中的值(而非数据列中的值)来计算总计。如需问题排查提示,请参阅将可能令人困惑的表格计算总和显示为 null 最佳实践页面。
  • 如果您已按测量单位过滤查询,则总计值可能过高。但实际上,您看到的是应用衡量指标过滤器之前的数据总和。换言之,测量过滤条件可能会隐藏查询结果中的部分数据,即使这些数据包含在总计中。
  • 如果您已将总计值与合并结果结合使用,Looker 会计算每个组成部分查询的总计值,并在合并结果中使用这些总计值。因此,显示的总计值可能过高,这是因为您看到的是在结果合并之前计算出的总计值。避免出现这种情况的一种方法是使每个查询的过滤条件对齐。
  • 同样,如果您对查询设置了行或列上限,而查询结果超出了该上限,总计值也可能会过高。不过,您看到的是系统在应用限制之前的数据总计。换言之,该限制可能会使某些数据无法显示在查询结果中,即使这些数据包含在总数中。

在上述列表中的第 3 和第 4 个项目符号中描述的情况,可以只计算您所看到的数据的总计。为此,您需要使用表格计算,本页后面会对此进行介绍。对于列总计,请使用 sum(${view_name.field_name})。对于行总计,请使用 sum(pivot_row(${view_name.field_name}))

探索查询的费用估算

对于 BigQueryMySQLAmazon RDS for MySQLSnowflakeAmazon RedshiftAmazon AuroraPostgreSQL、Cloud SQL for PostgreSQL 和 Microsoft Azure PostgreSQL连接,“探索”页面会提供查询的估算费用。从字段选择器中选择一个或多个字段,然后不要立即运行查询。“探索”页面会计算查询所需的数据量,并在运行按钮附近显示相关信息。

“探索”的“运行”按钮下方,查询时区旁边显示“将处理 56.0 KB”文本。

“探索”页面会根据查询显示不同的信息:

  • 对于对数据库的新查询,“探索”页面会显示将要处理的字节数。
  • 对于可以从缓存中提取的查询,“探索”页面会显示将从缓存中提取的行数。
  • 对于使用聚合感知优化的查询,“探索”页面会显示使用聚合感知时将处理的字节数和将节省的字节数。

费用估算的计算因方言而异。使用 Looker 的 EXPLAIN 函数来查看数据库如何处理查询。

面向开发者的功能

根据您的权限,您可能会在“探索”字段选择器中看到多项专为 Looker 开发者设计的功能:

  • 借助所有字段使用中标签页中的前往 LookML 选项,开发者可以导航到探索的 LookML。
  • 借助字段的信息图标菜单中的 sql 参数定义,开发者无需转到字段的 LookML 即可查看字段的 sql 定义。
  • 通过字段的信息图标菜单中的 Go to LookML 选项,开发者可以查看字段的 LookML。

您还可以在“探索”的数据表格齿轮菜单(针对字段)和探索操作齿轮菜单中看到多项功能:

  • 通过字段数据表齿轮菜单中的 Go to LookML 选项,Looker 开发者可以前往字段的 LookML 定义。
  • 通过“探索”的数据部分中的 SQL 标签页,Looker 开发者可以查看 Looker 发送到数据库以检索数据的 SQL 查询
  • 借助“探索”操作齿轮菜单中的 Get LookML 选项,开发者可以为“探索”的查询复制 LookML,以便将功能块添加到 LookML 信息中心、使用汇总表提升查询性能,或定义原生派生表

探索查询跟踪器

如果探索查询跟踪器实验室功能已启用,并且“探索”可视化面板或数据面板处于打开状态,则在“探索”查询运行时,系统会显示探索查询跟踪器(供您查看查询进度)。

总结

现在,您已了解 Looker 探索页面在构建查询、显示结果和通过迭代搜索发掘数据洞见方面的强大功能,建议您了解如何执行以下操作: