本页面介绍了如何使用 Looker 进行数据探索。请阅读以下部分,了解这些 Looker 概念:
- 如何在 Looker 中查找探索
- 如何以“快速入门”中的分析为基础进行“探索”分析
- 如何向探索添加字段
- 如何使用字段选择器
- 如何移除字段
- 如何对数据进行排序
- 如何透视数据
- 如何对列重新排序
- 如何显示总计
- 如何查看查询费用的估算值
- 如何使用为开发者提供的功能
如需详细了解“探索”页面上的组件以及如何与“探索”数据交互,请访问查看“探索”并与之互动文档页面。
探索是探索的起点
“探索”是旨在探索特定学科领域的查询的起点。从左侧导航面板中选择探索选项,以打开探索菜单。
探索菜单显示许多描述性的模型或组名称,按字母数字顺序进行整理。在探索菜单中,您可以搜索和选择探索,这些探索按照其所属的模型或组名称,按字母数字顺序排列。
例如,如果您经营一家电子商务商店,可以使用“探索”菜单查找包含“探索”的模型或组,这些探索包含这些探索,以便您查看电子商务商店数据。
您可以在探索菜单中展开或收起模型或组名称,以显示探索列表。您可以通过选择探索的名称来打开“探索”页面。
例如,电子商务商店模型包含探索订单商品(与订单关联的商品)、订单(购买事件)、商品(关于商品目录商品的信息)和用户(与购买事件关联的个人)。如果您对与订单关联的商品有疑问,不妨选择订购商品“探索”。
探索包含视图,视图是维度和测量的分组。“探索”中显示的数据取决于您从左侧字段选择器中列出的视图中选择的维度和测量值。维度可以视为一个组或一个存储桶。测量是指有关该数据存储桶的信息。在探索数据表中,维度显示为蓝色列,测量值显示为橙色列。
例如,要显示每天的下单数量,用户可以从订单商品探索的订单视图中选择创建日期维度和衡量数量。
如果探索包含根据模型估算的查询,您可以使用“快速入门”分析来填充字段。下一部分将深入介绍“快速入门”分析,以及如何以这些分析为起点探索数据。
快速入门分析
建模查询可作为“探索”中的“快速入门”分析选项使用。快速入门分析是一个很好的起点,可以快速运行和构建分析。
“快速入门”分析卡片显示在空白的“探索”中的字段选择器右侧。每张“快速入门”分析卡片都会显示分析的名称,以及说明(如果有)。
如需详细了解开发者如何为用户提供针对预构建的分析建模,请参阅 query
参数文档页面。
从空白的“探索”部分选择“快速入门”选项
要运行“快速入门”分析,请选择您要探索的分析选项。查询将自动运行并显示结果,包括可视化图表。
在快速入门分析运行后,您可以通过以下方式修改该分析:在所有字段标签页、搜索结果或正在使用标签页中的字段选择器标签页中添加或移除字段。
在“探索”运行后选择“快速入门”选项
探索运行完毕后,您可以选择“探索”名称旁边的快速入门闪电图标,选择新的“快速入门”分析。
选择此图标会打开快速入门菜单,其中显示了可用的分析卡片。
从菜单中选择“快速入门”分析后,系统会运行该分析,并替换之前的所有“探索”结果(现有过滤条件除外)。
“快速入门”过滤器行为
过滤条件具有累加性。这意味着,在运行时,“快速入门”分析将包含所有现有的“探索”过滤条件。如果所选“快速入门”分析的过滤条件值与现有“探索”过滤条件冲突,系统会提示您选择要在分析中使用的过滤条件值。
例如,您当前正在查看包含以下过滤条件的“探索”查询的结果:
- 订单创建日期的年份为“2019”。
- 订单状态为“完成”。
- Users State 等于“华盛顿州”。
您想选择一项名为按月统计的加拿大订单数的新“快速入门”分析,其中会显示 2019 年各月在加利福尼亚州下达的订单数量。
选择 Quick Start(快速入门)图标以打开“Quick Start”(快速入门)菜单,然后选择 CA order count by months(按月统计的 CA 订单数)分析选项:
“CA 订单数(按月)”分析的“用户状态”过滤条件的过滤条件值存在冲突。系统会打开选择过滤条件集菜单,系统会提示您选择保留当前过滤条件选项(列出当前过滤条件值)或选择替换为新过滤条件选项(其中列出了所选快速入门分析的过滤条件值),以解决冲突。
如需解决选择过滤条件集菜单中的冲突,请按以下步骤操作:
- 选择相应选项。
- 选择“保留当前过滤条件”以使用现有过滤条件值运行新的分析(在本例中,“用户状态”等于“华盛顿”)。
- 选择“替换为新过滤器”,以使用预构建的过滤条件运行新分析(在本例中,“用户状态”等于“加利福尼亚州”)。
- 选择应用以确认选择并运行分析。
运行“探索”时,更新后的“用户状态”为“加利福尼亚州”过滤条件,其中包含所有现有的非冲突过滤条件(订单创建日期为“2019 年”,订单状态为“已完成”)。
添加更多维度以获取更多详细信息
无论您是手动向“探索”添加字段,还是通过选择快速入门选项,都可以添加更多维度,以便详细了解您的数据。
要添加字段,请按以下步骤操作:
- 从字段选择器中选择一个字段,将其添加到查询中。
- 选择运行按钮以重新运行查询。
例如,在包含订单创建日期和订单数的“探索”中选择订单状态维度,系统会显示处于已取消或待处理状态的订单的数量(按日期显示)。
字段选择器
字段选择器位于“探索”页面左侧,包含以下元素(从上到下):
- “探索”名称会显示当前探索的名称。对于包含建模查询的探索,系统还会显示快速入门闪电图标,方便您在探索运行后访问快速入门分析选项。
- “查找字段”搜索栏可让用户搜索符合特定字词和条件的字段。
- 所有字段标签页会显示探索的所有可用字段。
- 正在使用标签页会显示当前使用的所有探索字段。
- 视图级摘要会显示视图中所选字段的总数。当视图收起和展开时,系统会显示此数字。
特定于字段的信息和操作图标可显示“探索”查询中字段的当前函数和潜在函数,以及字段的更多详情。
“探索”摘要会在左下角显示探索中的字段总数(在权限允许的情况下,包括自定义字段和表计算),并在右下角显示转到 LookML 链接。转到 LookML 可将用户定向到其 LookML 项目中的
explore
定义。只有拥有see_lookml
权限的用户才能看到此链接。
特定于字段的信息和操作
每个字段旁的图标可提供有关相应字段的更多信息,并指明该字段的可用选项。将光标悬停在字段上时,系统会显示这些图标。
您可以选择某个图标,以根据字段的数据类型对包含字段的查询执行多项更改,包括按字段进行过滤或透视数据。您还可以使用图标来表示字段的相关信息,或在权限允许的情况下,根据该字段创建自定义字段。
可用的图标和函数包括:
- 透视数据图标 - 选择此图标可透视或取消透视“探索”中的字段。当字段未透视时,此图标会显示为灰色;当字段经过透视时,此图标会显示为粗体。
按字段过滤图标 过滤查询结果,也可以移除作为过滤条件的字段。如果字段不是有效的过滤条件,此图标会显示为灰色;当过滤条件是有效的过滤条件时,此图标会显示为粗体。
- 选择此图标可按字段信息图标 信息 - 选择此图标可打开弹出式窗口,详细了解某个字段:
- 弹出式窗口将为所有用户显示该字段的数据类型、说明(如果有)和 LookML 字段名称(采用
view_name.field_name
语法)。 - 对于具有
see_lookml
权限的用户,弹出式窗口将包含 LookML 字段的sql
参数的定义,以及用于导航到 LookML 项目中该字段的链接。
- 弹出式窗口将为所有用户显示该字段的数据类型、说明(如果有)和 LookML 字段名称(采用
在某些情况下,用户可以使用三点状更多菜单
:- 当用户拥有
create_custom_fields
权限时。 - 在“探索”查询中选择维度组时。正在使用标签页中的维度组将显示三点状更多菜单。
拥有
create_custom_fields
权限的用户可以使用三点状更多菜单,根据字段的类型快速创建自定义字段。- 当用户拥有
“所有字段”标签页
默认情况下,当您打开现有探索时,系统会显示所有字段标签页。此标签是构建探索的起点,它显示了您可以为查询选择的所有可用字段。字段在定义字段的视图或视图标签名称下按类型(维度,后跟测量值)的字母数字排列。每个字段都会显示特定于字段的信息和操作,例如“探索”查询中某个字段的当前函数和潜在函数。
查询中选定的字段会以灰色背景突出显示,而相应的字段图标(数据透视、过滤器)会以粗体显示,而无需您将光标悬停在处于活跃状态的字段上。例如,在上述字段选择器示例中,利润字段以灰色突出显示,表示该字段已被选中。您可以确认此字段未经过透视或过滤,因为所有对应的字段图标都不是粗体,并且当您没有将鼠标悬停在该字段上时,它不会显示。
从所有字段标签页中选择一个字段,将其添加到探索查询中或从中移除。此外,您可以选择相应的字段图标,在“所有字段”标签页中进行过滤、透视或执行其他特定于字段的操作。
自定义字段和表格计算列在“自定义字段”视图标签下。具有 create_table_calculations
权限的用户可以创建和修改表计算,具有 create_custom_fields
权限的用户可以创建和修改自定义字段,方法是选择视图标签旁边的添加按钮,或者从字段的三点状更多菜单中选择自定义字段选项。
“正在使用”标签页中
使用中标签页会显示探索中当前有效的所有字段(按视图或视图标签的字母数字排序),以及它们是维度还是测量值:
使用中标签页还会在该标签页底部显示更新后的探索摘要。左下角显示探索中有效字段的总数。具有 see_lookml
权限的用户可在右下角找到转到 LookML 链接。转到 LookML 可将用户定向到其 LookML 项目中的 explore
定义。上面的示例显示“探索”中目前共有四个活动字段。
从“正在使用”标签中移除字段
使用某个字段时,您可以从字段选择器中选择该字段的名称,将其从“探索”中移除。
您还可以选择全部清除移除所有选定字段(包括自定义字段和表计算);也可以选择清除字段,保留过滤条件,移除所有字段(包括自定义字段和表计算),但有效过滤条件除外。这些选项都不能移除自定义过滤条件;要移除自定义过滤条件,您需要手动取消选中该过滤条件旁边的复选框。
或者,您可以从“使用中”标签页选择过滤、透视或执行其他特定于字段的操作,方法是选择相应的字段图标。
“使用”标签页中字段专用图标和操作
每个字段旁边的图标表示“探索”查询中该字段的当前函数和潜在函数。在探索中使用自定义字段和表计算时,它们会在自定义字段视图标签下列出。具有 create_table_calculations
权限的用户可以创建和修改表计算,具有 create_custom_fields
权限的用户可以创建和修改自定义字段,方法是选择添加按钮,或从字段的三点状更多菜单中选择自定义字段选项。
用户必须拥有 create_table_calculations
或 create_custom_fields
权限才能查看三点状更多菜单。唯一的例外是“正在使用”标签页中的维度组,“使用中”标签页中显示的维度组将会显示三点状的更多菜单。
在“探索”的数据表中启用一个维度组后,用户可以使用三点状“更多”菜单访问“切换到”列表,从而将所选时间范围替换为另一个时间范围(如果有),无需手动取消选择一个字段并选择另一个字段:
当您从“切换到”列表中选择新的时间范围后,“探索”会自动重新运行,并显示更新后的结果。使用“切换到”功能时,系统仅会替换“探索”数据表中的时间范围,不会替换已过滤的时间范围。
搜索栏
借助搜索功能,您可以快速选择构建探索所需的特定字段。
在搜索栏中输入搜索字词
在搜索栏中输入字符串将会对字段选择器进行过滤,仅显示说明与搜索字符串的全部或部分内容匹配的字段、视图和字段。
如要进行搜索,请先输入字词。您还可以选择搜索选项链接,选择限制搜索的选项:
不限 - 选择此选项可在字段选择器中随意搜索您输入的字词。如果探索的字段数不超过 5,000,这是默认选项。
字段标签 - 选择此选项可将字段选择器搜索范围限制为字段名称。对于包含超过 5,000 个字段的探索,这是默认选项。
字段说明 - 选择此选项可将字段选择器搜索范围限制为字段说明。
维度组 - 选择此选项可将字段选择器搜索范围限制为维度组。
视图名称 - 选择此选项可将字段选择器搜索限定为查看名称。
过滤后字段选择器提供的功能与所有字段标签页部分相同。
移除字段
如需从探索中移除字段,请执行以下操作:
- 在字段选择器中选择所需字段,或在“探索”数据表格中列的齿轮菜单中选择移除。
- 选择运行按钮以重新运行查询。
您还可以使用键盘快捷键 Command-K (Mac) 或 Ctrl+K (Windows) 移除“探索”中的所有字段。
将数据排序
“探索”部分会在客户端(在用户浏览器中)执行某些排序,以减少对数据库的往返调用次数,这不仅费用高昂,而且非常耗时。但是,这种行为可能会导致“探索”结果与其他 Looker 内容之间不一致,因为在客户端和数据库之间排序可能会产生不同的结果,尤其是在系统语言区域不同的情况下。
默认情况下,“探索”页面上的非透视数据会按照以下优先级进行排序:
- 第一个日期维度(降序)
- 如果不存在日期维度,则按降序方式创建第一个测量
- 如果不存在测量,则添加的第一个维度(升序)
如需了解如何对透视数据进行排序,请参阅数据透视和排序部分。
字段的排序顺序在数据表中以以下几种方式表示:
- 在字段名称旁边显示一个数字,用于区分相应字段的排序依据
- 在字段名称旁显示一个指示排序方向的箭头(向上指代表升序,朝下代表降序)
- 将鼠标悬停在字段名称上时即会显示弹出式窗口
您可能需要以不同于默认顺序的方式对数据进行排序。您可以通过在数据表中选择字段名称,按该字段对查询进行排序:
- 选择一次字段名称可按该字段降序排序。
- 选择两次字段名称可按升序对该字段进行排序。
您可以根据需要多次选择字段,以获得所需的排序顺序。
例如,包含“订单创建日期”“用户状态”和“订单数量”的“探索”查询目前按“订单创建日期”降序排序。
但是,您想要查看回头客(即并非首次购买的客户)订单量最大的日期。选择订单商品数列标题可对查询进行重新排序,从而按订单数由高到低显示。Order Items Count 旁边的向下箭头表示结果现在按此字段降序排序。此外,当您将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口来确认排序顺序:
按多个字段排序
要对多个字段进行排序,请按住 Shift 键,然后按您希望的顺序选择列标题。
Orders Created Date(订单创建日期)和 Order Items Count(订单商品数)字段名称旁边的箭头表示该表按这两个字段进行排序,以及表的排序顺序。Orders Created Date(订单创建日期)是第二个排序依据字段(降序),通过向下键和字段名称旁的 2 来指示。
您还可以使用 case
参数创建自定义排序。
透视维度
当您水平透视多个维度时,通常可以更轻松地查看多个维度。该维度中的每个值都将成为 Look 中的一列。这使得信息更直观、更直观,无需向下滚动即可查找数据。Looker 最多支持 200 个透视值。
若要按维度透视“探索”结果,请执行以下操作:
- 将鼠标悬停在字段选择器中的相应维度上,然后选择透视数据图标。
- 选择运行以重新运行查询。
- 您可以通过以下两种方式之一逆透视字段:
- 从数据表中列顶部的字段齿轮图标菜单中选择逆透视选项
- 在字段选择器中再次选择该维度的透视数据图标
数据透视和 null
值不会出现在列中的数据行使用 null 值符号(零值)表示,中间有一条斜线。例如,12 月 21 日,没有已完成的订单:
数据透视和排序
您也可以在数据表中选择维度的标题,对透视维度进行排序。若要按多个透视维度进行排序,请按住 Shift 键,然后按照所需的排序顺序选择维度标题。对透视测量进行排序时,首先对该列中包含值的行进行排序,然后对该列中没有数据的行进行排序(用 null 值符号表示)。
您还可以使用 case
参数创建自定义排序。
对列重新排序
您可以对数据部分中的列重新排序,只需选择列标题并将列拖放到所需位置即可。在您选择运行按钮后,探索的可视化图表会反映新的列顺序。
系统会按字段类型在数据部分中整理各个列:
在大多数情况下,可以在每个字段类型中对列重新排序,但无法将列移出字段类型部分。
例如,可以在维度表计算之间重新排列,但不能将维度表计算放在两个测量之间。
但有一种例外情况,那就是您可以使用数据标签页中“行总计”复选框旁边的箭头,将行总计列从数据表的最右侧移到维度表计算结果后面。
您可以对透视维度下的列进行重新排序,但只能通过更改排序顺序来更改透视维度的顺序,而不能通过手动重新排序进行更改。
显示总计
有时,数据摘要会很有用。您可以向探索查询中添加列总计,方法是选中“探索”数据表右上角的总计复选框,然后重新生成报告。
如果“探索”查询包含多个维度,您可以选择在表格可视化图表中包含小计,只需勾选总计复选框旁边的“探索数据”表右上角的小计复选框即可。仅当您的查询包含多个维度时,才会显示小计复选框。
您还可以选中数据表右上角的行总计复选框,将行总计添加到透视“探索”查询中。仅当“探索”查询包含透视维度时,行总计复选框才可用。
如果您添加了行总计,并且您的查询超出了您设置的任何行数上限,那么您将无法对行总计列进行排序(但可以照常对维度进行排序和衡量列)。这是因为数据中可能缺少应包含在总计中的行。如果您遇到此问题,可以尝试提高查询的行数上限(最多 5,000 行)。
没有总计数据时
在以下情况下不会显示总计数据:
- 列总计仅适用于专门引用测量的测量和表计算,而不适用于引用维度的维度或表计算。
- 行总计仅适用于测量,而不适用于基于维度或维度的表计算。
- 由于数据库限制或值对总计没有意义,某些类型的列不会求和。例如,您无法将字词列表相加。
有关总计的注意事项
此外,关于总计数据在某些情况下的运作方式,您需要注意以下几点:
- 计数唯一项的列数之和可能并不符合您的预期,因为相同的项可能会出现在多个类别中,但在总计中只会被计为一个唯一项。
- 行总计功能会创建一个额外的查询,且此查询的行数上限为 30,000 行。如果您的“探索”查询超过 30,000 行,则系统仅会显示前 30,000 行的总行数。此外,如果数据是透视的,则数据透视中的选项数会进一步减少行总数限制。
- 一些执行聚合的表计算(例如使用
percentile
或median
的计算)的合计可能与预期不符。这是因为,表计算在使用“总计”行中的值(而非数据列中的值)来计算总计。有关问题排查提示,请参阅将可能令人困惑的表计算总计显示为 null 最佳实践页面。 - 如果您按某种衡量指标过滤了报告,则总计值可能会偏高。但实际上,您看到的是应用衡量过滤条件之前的数据总计。也就是说,即使总数据中包含这些数据,衡量过滤器可能会隐藏报告中的部分数据。
- 如果您在使用总计值时使用了合并结果,Looker 会计算每个组成部分查询的总计值,并在合并结果中使用这些总计值。因此,总计值可能会偏高,这是因为您看到的是合并结果之前计算得出的总计值。为避免此问题,一种方法是调整每个查询的过滤条件。
- 同样,如果您为报告设定了行或列的限制,而您的报告超出了这一限制,则总计值可能也看上去过高。不过,您看到的是应用限制之前的数据总计。换言之,这些限制可能会致使报告中隐藏部分数据,即使这些数据包含在总计中。
在上述第三和第四项所述的情况下,我们只能针对您可以看到的数据计算总计值。为此,您需要使用表格计算,本页面稍后会对此进行说明。如需查看列总计,请使用 sum(${view_name.field_name})
。如需查看行总计,请使用 sum(pivot_row(${view_name.field_name}))
。
“探索”查询的费用估算
对于 BigQuery、MySQL、Amazon RDS for MySQL、Snowflake、Amazon Redshift、Amazon Aurora、PostgreSQL、Cloud SQL for PostgreSQL 和 Microsoft Azure PostgreSQL 连接,“探索”页面会提供查询费用的估算值。从字段选择器中选择一个或多个字段,并避免立即运行查询。“探索”页面将计算查询需要的数据量,并在运行按钮附近显示相关信息。
“探索”页面会根据查询显示不同的信息:
- 对于数据库上的新查询,“探索”页面会显示将要处理的字节数。
- 对于可从缓存中提取的查询,“探索”页面会显示将从缓存中提取的行数。
- 对于使用聚合认知度优化的查询,“探索”页面会显示使用聚合感知将要处理的字节数以及将节省的字节数。
费用估算值的计算因方言而异。您可以使用 Looker 的 EXPLAIN
函数来查看数据库是如何处理查询的。
面向开发者的功能
您可能会在探索字段选择器中看到专为 Looker 开发者设计的多项功能,具体取决于您的权限:
- 所有字段和正在使用标签页中的转到 LookML 选项可让开发者前往探索的 LookML。
- 字段的信息图标菜单中的
sql
参数定义可让开发者查看字段的sql
定义,而无需转到字段的 LookML。 - 字段的 Info 图标菜单中的 Go to LookML 选项可让开发者查看字段的 LookML。
您可能还会在“探索”数据表格齿轮菜单中(对于字段)和探索操作齿轮菜单中看到多项功能:
- 字段的数据表齿轮菜单中的转到 LookML 选项可让 Looker 开发者导航到字段的 LookML 定义。
- 通过“探索”的数据部分中的 SQL 标签页,Looker 开发者可以查看 Looker 发送到数据库以检索数据的 SQL 查询。
- 借助探索操作齿轮菜单中的获取 LookML 选项,开发者可以复制探索查询的 LookML,从而将图块添加到 LookML 信息中心、使用汇总表提升查询性能,或定义原生派生表。
总结
现在,您已经了解了 Looker 探索页面在构建查询、显示结果和通过迭代搜索发掘数据洞见方面的强大功能,不妨了解如何执行以下操作:
- 过滤并限制您的结果,使其仅显示您感兴趣的数据。
- 使用表计算来创建临时的“探索”指标。
- 使用自定义字段来创建临时维度和测量。
- 创建可视化图表。
- 将探索查询保存为 Look。
- 向信息中心添加“探索”查询。
- 与其他用户共享数据。