本页向您介绍如何使用 Looker 进行数据探索。请阅读以下部分,了解这些 Looker 概念:
- 如何在 Looker 中查找“探索”功能
- 如何使用“快速入门”分析作为“探索”的起点
- 如何向“探索”页面添加字段
- 如何使用字段选择器
- 如何移除字段
- 数据排序方式
- 如何转换数据
- 如何对列重新排序
- 如何显示总计数据
- 如何查看查询费用的估算值
- 如何使用面向开发者的功能
要详细了解“探索”页面上的各个组件以及与“探索”数据的互动,请访问查看“探索”并与之互动文档页面。
探索是探索的起点
探索是查询的起点,旨在探索特定主题区域。从左侧导航面板中选择探索选项,以打开探索菜单。
探索菜单会显示一些描述性的模型或群组名称,这些名称按字母数字顺序排列。在探索菜单中,您可以搜索并选择“探索”,这些探索按其所属的模型或群组的名称以字母顺序整理。
例如,如果您经营一家电子商务商店,则可以使用探索菜单来查找包含“探索”模型的模型或群组,以便您查看电子商务商店数据。
您可以在探索菜单中展开或收起模型或组名称,以显示探索列表。通过选择“探索”的名称,您可以打开“探索”页面。
例如,“电子商务”商店模式包括“探索”订单项(与订单相关联的产品)、“订单”事件(与产品目录产品相关的信息),以及“用户”(与购买事件相关的用户)。如果您对某个订单的相关商品存有疑问,可能需要选择订单商品“探索”。
探索包含数据视图(即维度和衡量组)。“探索”中显示的数据由您在左侧字段选择器中列出的视图中进行选择。您可以将维度视为一组或一组数据。“衡量”是指有关相应存储桶的数据。在“探索”数据表格中,维度显示为蓝色列,衡量指标显示为橙色列。
例如,要显示每天所下的订单数,用户可以从订单项目探索的订单视图中选择维度“创建日期”和衡量指标“计数”。
如果“探索”包含根据模型估算的查询,您可以使用“快速入门”分析来填充字段。下一部分深入介绍了快速入门分析,以及如何以这些数据为基础探索数据。
快速入门分析
根据模型估算的查询在“探索”中会以“快速入门”分析选项的形式提供。“快速入门”分析为快速运行和构建分析提供了实用的起点。
“快速入门”分析卡片位于空白“探索”字段的右侧。每张“快速入门”分析卡会显示分析的名称,以及一个说明(如果有)。
如需详细了解开发者如何为用户预构建分析,请参阅 query
参数文档页面。
从空白的“探索”中选择“快速入门”选项
如需运行快速入门分析,请选择要探索的分析选项。查询将自动运行并显示结果,包括可视化图表。
对于“快速入门”分析,您可以在其运行后,通过从所有字段标签页中、搜索结果中或从字段选择器中的使用中标签页添加或移除字段中进行修改。
运行“探索”后,选择“快速入门”选项
“探索”运行完毕后,您可以选择“探索”名称旁边的快速入门闪电图标,来选择一项新的快速入门分析。
选择此图标可打开“快速入门”菜单,其中显示了可用的分析卡。
从菜单中选择“快速入门”分析即可运行分析,并替换之前的所有探索结果,但现有的过滤条件除外。
“快速入门”过滤器的行为
过滤条件可以累加使用。这意味着,在运行期间,“快速入门”分析将包括所有现有的“探索”过滤条件。如果所选“快速入门”分析中的过滤条件值与现有“探索”过滤条件冲突,系统会提示您选择在分析中使用的过滤条件值。
例如,您当前正在查看包含以下过滤条件的“探索”查询的结果:
- Orders Created Date(订单创建日期)为“2019”年。
- 订单状态等于“完成”。
- 用户状态等于“华盛顿州”。
您希望选择一个名为“加拿大订单数量(按月)”的新数据分析,其中会显示 2019 年内加利福尼亚的订单数量。
选择 Quick Start 闪电图标以打开“快速入门”菜单,然后选择 CA order count by months 分析选项:
“CA 订单数量(按月)”分析的“用户状态”过滤条件的过滤条件值存在冲突。系统会打开选择过滤条件集菜单,提示您选择保留当前过滤条件选项(列出当前过滤条件值)或替换为新过滤条件选项(其中列出了所选“快速入门”分析的过滤条件值)以解决冲突。
若要解决选择过滤条件集菜单中的冲突,请按以下步骤操作:
- 选择相应选项。
- 选择保留当前过滤条件,使用现有过滤条件值运行新的分析(在本例中,用户状态等于“华盛顿州”)。
- 选择替换为新过滤条件,以运行使用预构建过滤条件的新分析(在本例中,用户状态等于“加利福尼亚州”)。
- 选择应用,确认选择并执行分析。
“探索”在更新后的用户状态下选择了“加利福尼亚州”过滤条件,并且包含任何现有的非冲突过滤条件(订单创建日期为“2019 年”,订单状态为“完成”)。
添加更多维度,了解更多详细信息
无论您是手动将字段添加到“探索”中,还是选择快速入门选项,都可以添加更多维度以详细了解您的数据。
如需添加字段,请按以下步骤操作:
- 从字段选择器中选择字段以将其添加到查询中。
- 选择运行按钮以重新运行查询。
例如,如果在“探索”中选择包含订单创建日期和订单数的订单状态维度,系统就会显示处于“已完成”、“待处理”或“已取消”状态的订单数量。
字段选择器
字段选择器位于“探索”页面的左侧,它从上到下包含以下元素:
- “探索”名称会显示当前“探索”的名称。对于包含根据模型估算的查询的“探索”工具,系统还会显示快速入门闪电图标,以便您在“探索”运行后访问快速入门分析选项。
- 查找字段搜索栏可让用户搜索符合特定字词和条件的字段。
- 所有字段标签页会显示探索功能的所有可用字段。
- 使用中标签页会显示当前正在使用的所有“探索”字段。
- 视图级摘要会显示视图中选定字段的总数。视图收起时和展开时,此数字即会显示。
特定于字段的信息和操作图标用于在“探索”查询中显示字段的当前和可能的函数,以及关于某个字段的更多详情。
“探索”摘要会在左下角显示“探索”中的字段总数(包括自定义字段和表格计算结果),同时在右下角显示前往 LookML 链接。前往 LookML 即可引导用户前往其 LookML 项目的
explore
定义。只有拥有see_lookml
权限的用户才能看到此链接。
特定于字段的信息和操作
每个字段旁边的图标可提供有关该字段的更多信息,并指明该字段的可用选项。将光标悬停在某个字段上时,您可以看到对应的图标。
选择一个图标,可以根据某个字段的数据类型对该字段执行多项更改,包括按某个字段进行过滤或数据透视。您还可以使用图标来了解有关某个字段的信息,或在权限允许的情况下,根据该字段创建自定义字段。
可用的图标和函数包括:
- 数据透视数据图标 - 选择此图标可对数据探索字段中的字段进行数据透视或取消透视。如果某个字段未进行数据透视,该图标会显示为灰色;一旦某字段被转换,便会显示为粗体。
按字段过滤图标 过滤查询结果,或移除作为过滤条件的字段。如果某字段不是有效过滤条件,此图标会显示为灰色;如果该字段处于有效状态,则会显示为粗体。
- 选择此图标可按字段信息图标 info - 选择此图标可打开弹出式窗口以详细了解某个字段:
- 弹出式窗口将为所有用户显示字段的数据类型、说明(如有)和 LookML 字段名称(采用
view_name.field_name
语法)。 - 对于具有
see_lookml
权限的用户,弹出式窗口中会包含 LookML 字段的sql
参数的定义,以及指向 LookML 项目中该字段的链接。
- 弹出式窗口将为所有用户显示字段的数据类型、说明(如有)和 LookML 字段名称(采用
在特定情况下,用户可以使用三点状更多菜单
:- 用户拥有
create_custom_fields
权限。 - 在“探索”查询中选择维度组后。使用中 标签页上将显示三点状更多菜单。
拥有
create_custom_fields
权限的用户可以使用三点状更多菜单根据字段的类型快速创建自定义字段。- 用户拥有
“所有字段”标签页
当您打开现有“探索”时,系统会默认显示所有字段标签页。标签页是开始创建“探索”的起点,此处会显示您可以为查询选择的所有可用字段。这些字段按其所属类型的视图或视图标签的名称进行了字母数字排序(维度后跟衡量)。每个字段都会显示特定于字段的信息和操作,例如“探索”查询中的字段当前函数和潜在函数。
查询中选择的字段会以灰色背景突出显示,并且相应的字段图标(数据透视、过滤器)将以粗体显示,您无需将鼠标悬停在相应字段上时将其激活。例如,上方字段选择器示例中的利润字段以灰色突出显示,表示该字段处于选中状态。您会注意到,该字段并非透视或过滤,因为所有对应的字段图标都不是粗体的,当您将鼠标悬停在此字段上时不会显示它们。
从所有字段标签页中选择相应字段,以将其添加到“探索”查询中或从中移除。此外,您还可以选择相应的字段图标,从“所有字段”标签页进行过滤、转换或执行其他针对特定字段的操作。
自定义字段和表格计算列于自定义字段视图标签下。拥有 create_table_calculations
权限的用户可以创建和修改表格计算,而拥有 create_custom_fields
权限的用户则可以创建和修改自定义字段,方法是选择视图标签旁边的添加按钮,或者从某个字段的三点更多菜单中选择自定义字段选项。
在“使用”标签页中
使用中标签页会显示“探索”中当前有效的所有字段(按视图或视图标签按字母数字顺序排列),以及这些字段是维度还是度量:
使用中标签页还会在标签页底部显示更新后的“探索”摘要。左下角显示了“探索”专区中的有效字段总数。用户可在 see_lookml
右下角找到 Go to LookML 链接。前往 LookML 即可引导用户前往其 LookML 项目的 explore
定义。上面的示例显示,“探索”中总共有四个有效字段。
从“使用中”标签页中移除字段
使用某个字段时,您可以从字段选择器中选择该字段的名称,将其从“探索”中移除。
您还可选择全部清除以移除所有选定字段(包括自定义字段和表格计算结果),或者选择清除字段、保留过滤条件以移除所有字段(包括自定义字段和表格计算字段)。这些选项都不能移除自定义过滤条件;要移除自定义过滤条件,您需要手动取消选中该过滤条件旁边的复选框。
或者,您也可以选择相应的字段图标,从“使用中”标签页中选择过滤、透视或执行其他字段特有的操作。
在“使用”标签页中因字段而异的图标和操作
每个字段旁边的图标表示该字段在“探索”查询中的当前函数和潜在函数。当在探索中使用时,自定义字段和表计算列在自定义字段视图标签下。拥有 create_table_calculations
权限的用户可以创建和修改表格计算,而具有 create_custom_fields
权限的用户可以通过选择添加按钮或从字段的三点状更多菜单选择自定义字段选项来创建和修改自定义字段。
用户必须拥有 create_table_calculations
或 create_custom_fields
权限才能查看三点状更多菜单。唯一的例外是“正在使用的”标签页中的“维度组”,对于“使用中”标签页中显示的维度组,系统会显示三点状的“更多”菜单。
当“探索”的数据表格中启用了一个维度组时,用户可以使用三点状更多菜单访问切换到将所选时间范围替换为另一个时间范围(如果可用),而不必手动取消选择某个字段并选择另一个字段:
从切换到列表中选择新的时间范围后,“探索”功能会自动使用更新后的结果重新运行。使用切换到功能时,系统只会替换“探索”数据表格中的时间范围(而非过滤后的时间范围)。
搜索栏
借助搜索功能,您可以快速选择构建探索所需的特定字段。您可以通过多种方式从搜索中选择字段,包括:
在搜索栏中输入搜索字词
在搜索栏中输入字符串后,系统会过滤字段选择器,使系统仅显示说明与搜索字符串完全或部分匹配的字段、视图和字段。
要执行搜索,请先输入一个字词。如果启用了高性能字段选择器实验室功能,您可以选择搜索选项链接来限制搜索:
- 字段标签 - 选择此选项可将字段选择器搜索限制为字段名称。
- 字段说明 - 选择此选项可将字段选择器搜索范围限制为字段说明。
- 维度组 - 选择此选项可将字段选择器搜索范围限制为维度组。
- View Name(视图名称)- 选择此选项可将字段选择器搜索范围限制为仅查看名称。
在下面的视频片段中,用户在字段选择器中搜索与字词“cost”匹配的内容,但未启用高性能字段选择器:
搜索字词匹配条件在每项内容中都会带有下划线,包括在字段说明中。例如,在搜索视频片段中,利润字段包含在被滤除的字段选择器结果中,因为部分说明与搜索字词“费用”相符。
过滤的字段选择器与所有字段标签页部分所述的功能相同。
在搜索栏中输入搜索修饰符
如果您想缩小字段选择器中的字段列表范围,可以使用 is
、type
、has
和 tags
或 tag
执行修改后的搜索。如果您想从字段类型(例如维度或测量)、结果机器学习数据类型(例如 type: string
或 type: number
)或者包含特定元素(例如说明)的字段中进行选择,修改后的搜索会非常有用。
修饰符可与搜索字词中的其他修饰符和搜索字词结合使用。例如,以下搜索会将显示的字段选择器字段缩小为包含说明的维度:
is:dimension has:description
要执行修改后的搜索,请在搜索栏中输入修饰符。支持的修饰符包括:
is
- 用于标识字段类型:
is:dimension
is:measure
is:filter
is:parameter
type
- 标识具有特定 LookML 数据类型的字段:
type:distance
type:duration
type:location
type:number
type:string
type:tier
type:time
type:yesno
type:zipcode
type:average_distinct
type:count_distinct
type:list
type:max
type:median_distinct
type:min
type:percent_of_previous
type:percent_of_total
type:percentile_distinct
type:running_total
type:sum_distinct
type:date_date
type:date_raw
type:date_time_of_day
type:date_hour
type:date_hour_of_day
type:date_hourX
type:date_minute
type:date_minuteX
type:date_second
type:date_millisecond
type:date_millisecondX
type:date_microsecond
type:date_week
type:date_day_of_week
type:date_day_of_week_index
type:date_month
type:date_month_num
type:date_month_name
type:date_day_of_month
type:date_fiscal_month_num
type:date_quarter
type:date_quarter_of_year
type:date_fiscal_quarter
type:date_fiscal_quarter_of_year
type:date_year
type:date_day_of_year
type:date_week_of_year
type:date_fiscal_year
type:date
type:sum
type:percentile
type:median
type:count
type:average
type:date_time
type:date_time_of_day
type:date_hour
type:date_hour_of_day
type:date_hourX
type:date_minute
type:date_minuteX
type:date_second
type:date_millisecond
type:date_millisecondX
type:date_microsecond
has
- 用于标识包含特定元素的字段:
has:description
tags
或 tag
- 使用 LookML tag
标识字段:
tag:braze_id
tags:braze_id
tag:email
tags:email
移除字段
要从“探索”中移除字段,请执行以下操作:
- 在字段选择器中选择所需字段,或从“探索数据”表格的列齿轮图标中选择移除。
- 选择运行按钮以重新运行查询。
您也可以使用键盘快捷键 Command-K (Mac) 或 Ctrl+K (Windows) 移除“探索”中的所有字段。
数据排序
“探索”中的某些排序是在客户端(在用户浏览器中)执行的,以减少对数据库的往返调用次数,成本和时间都很高。不过,这种行为可能会导致探索结果与其他 Looker 内容不一致,因为在客户端和数据库之间排序可能会产生不同的结果,尤其是在系统语言区域不同时。
默认情况下,“探索”页面上的未透视数据会根据以下优先级进行排序:
- 第一个日期维度(降序)
- 如果没有日期维度,则第一种衡量指标(降序)
- 如果没有任何测量值,第一个添加的维度(升序)
如需了解如何对透视数据进行排序,请参阅数据透视和排序部分。
在数据表中,字段的排序顺序有以下几种:
- 字段名称旁边带有数字,用于与其他排序字段区分排序依据
- 字段名称旁边有一个指示排序方向的箭头(指向升序或向下箭头)
- 当您将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口
数据排序方式可能与默认顺序不同。通过在数据表中选择字段名称,可以按该字段对查询进行排序:
- 只要选择一次字段名称,即可按字段降序排序。
- 两次选择字段名称,以升序对字段进行排序。
您可以根据需要多次选择某个字段,以达到所需的排序顺序。
例如,包含订单创建日期、用户状态和订单数量的“探索”查询目前按订单创建日期降序排列。
但是,您希望查看回头客的订单量最多(即未进行首次购买的客户)的日期。点击订单项数列标题可重新对查询进行排序,以显示订单数量从高到低的日期。“订单条目数”旁边的向下箭头表示结果已按此字段降序排列。此外,将鼠标悬停在字段名称上时,系统会显示一个弹出式窗口,确认排序顺序:
按多个字段排序
要对多个字段进行排序,请按住 Shift 键,然后按所需的排序顺序选择列标题。
如果 Orders Created Date(订单创建日期)和 Order Items Count(订单项数量)字段名称旁边会显示箭头,则表示相应表是按这两个字段以及其排序顺序排序。Orders Created Date(订单创建日期)是第二个排序依据字段(降序),字段名称旁边会显示向下箭头和 2。
您还可以使用 case
参数创建自定义排序。
数据透视维度
在水平转换一个维度时,通常可以更轻松地查看多个维度。该维度中的每个值都将成为“外观”中的一列。这样会使信息易于直观查看,并不需要向下滚动即可查找数据。Looker 最多支持 200 个数据透视值。
要按维度透视数据探索结果,请按以下步骤操作:
- 将鼠标悬停在字段选择器中的维度上,然后选择数据透视数据图标。
- 选择运行以重新运行查询。
- 您可以通过以下两种方式之一取消字段的透视:
- 从数据表中列顶部的齿轮图标齿轮图标中选择数据透视选项
- 在字段选择器中再次选择该维度的数据透视数据图标
数据透视和 null
一行中未出现值的数据以 null 值符号表示(零值有斜线)。例如,在 12 月 21 日,没有已完成的订单:
数据透视和排序
您也可以在数据表中选择维度标题,对透视维度进行排序。若要按多个数据透视维度进行排序,请按住 Shift 键,然后按要排序的方式选择维度标题。如果您对数据透视衡量指标进行排序,则该列中包含值的所有行将会排在最前面,后跟该列中不含数据的行(以 null 值符号表示)。
您还可以使用 case
参数创建自定义排序。
对列重新排序
您可以在数据部分对列重新排序,方法是选择列标题,然后将列拖放到所需的位置。选择运行按钮后,“探索”的可视化图表会反映新的列顺序。
列按数据部分按字段类型进行整理:
在大多数情况下,各字段类型的列可以重新排序,但不能移出其字段类型部分。
例如,维度表格的计算可以相互重新排列,但维度表格的计算方式不能放在两个测量值之间。
不过,有一种例外情况:您可以使用数据标签页上行总计复选框旁边的箭头,将行总计列从数据表格最右侧移到维度表计算后面。
您可以对透视维度列下的列进行重新排序,但只能通过更改排序顺序(而不是手动重新排序)更改透视维度的顺序。
显示总计
有时,数据摘要非常有用。您可以向“探索”查询添加列总数,只需选中“探索”数据表格右上角的总计复选框,然后重新生成报告即可。
如果“探索”查询包含多个维度,您可以选择在表格可视化图表中加入小计,方法是选中“探索”数据表格,然后在总计复选框旁边选中小计复选框。仅当您的查询包含多个维度时,才会显示小计复选框。
还可以选中数据表格右上角的行总计复选框,为透视的“探索”查询添加行总计。仅当“探索”查询包含透视维度时,才能使用行总计复选框。
如果您添加了总计行,而您的查询超出了您设置的任何行数上限,您就无法对行总计列进行排序(但您可以照常对维度进行排序和衡量列)。原因在于,您的数据中可能缺少应计入总数的行。如果您遇到此问题,请尝试提高查询的行数上限(最多 5000 行)。
无法获得总计时
在以下情况下,系统不会显示总计值:
- “列总计”仅适用于仅提及衡量指标的衡量指标和表格计算,而不适用于引用维度的维度或表格计算。
- 行总计仅适用于测量值,而不适用于基于维度或维度的表格计算。
- 由于数据库限制或该值无法作为总计值,某些类型的列不会进行求和。例如,您不能将字词列表相加。
关于合计项的注意事项
此外,关于总数在特定情况下的运作方式,需要注意以下几点:
- 计算唯一项目的列可能不会按预期合计,因为相同的项目可能出现在多个类别中,但在总计中只会计为一个项目。
- “行总数”功能会额外创建一个查询,且此查询不得超过 30000 行。如果您的“探索”查询超过了 30,000 行,则系统只会显示前 30,000 行的总行数。此外,如果数据“转换”,行总计数上限将按数据透视中的选项数量进一步降低。
- 执行汇总的一些表格计算(例如使用
percentile
或median
的计算)可能无法按预期累积。这是因为表计算使用“总计”行中的值(而不是数据列中的值)来计算总计值。如需了解问题排查提示,请参阅可能容易混淆的表计算总数为 null 的最佳实践页面。 - 如果您按衡量指标过滤了报告,总计值似乎太高。但实际上,您实际看到的是,在应用衡量过滤条件之前,您的数据总计。也就是说,衡量过滤条件可能会隐藏报告中的某些数据,即使这些数据包含在总计中也是如此。
- 如果您为合并结果使用了总计,Looker 会计算每个组成部分查询的总计值,并在合并结果中使用这些总计值。所以,显示的总计值可能太高了,因为您所看到的值是合并结果之前计算出的总计值。避免这种情况的一种方法是为每个查询对齐过滤条件。
- 同样,如果您为报告设置了行数或列数上限,而您的报表超出了此上限,那么总计值可能也会过高。不过,您看到的是应用限制之前的数据总计。换言之,这些限制可能会隐藏报告中的某些数据,即使这些数据包含在总数中也是如此。
根据上述第 3 条和第 4 条中所述的情况,可以仅计算您可以查看的数据的总计值。为此,您需要使用表格来计算,如本页下文所述。如需计算列的总数,请使用 sum(${view_name.field_name})
。如需获得总行数,请使用 sum(pivot_row(${view_name.field_name}))
。
“探索”查询的费用估算值
对于 BigQuery、MySQL、Amazon RDS for MySQL、Snowflake、Amazon Redshift、Amazon Aurora、PostgreSQL、Cloud SQL for PostgreSQL 和 Microsoft Azure PostgreSQL 连接,“探索”页面提供了查询费用的估算值。请从字段选择器中选择一个或多个字段,并避免立即运行查询。“探索”页面将计算查询所需的数据量,并在运行按钮附近显示相关信息。
“探索”页面会根据查询显示不同的信息:
- 对于数据库上的新查询,“探索”页面将显示将处理的字节数。
- 对于可以从缓存中提取的查询,“探索”页面会显示将从缓存中提取的行数。
- 对于使用汇总感知优化的查询,“探索”页面会显示将处理的字节数以及将使用汇总感知保存的字节数。
费用估算值的计算方法为方言。使用 Looker 的 EXPLAIN
函数了解您的数据库如何处理查询。
面向开发者的功能
您可能会在“探索”字段选择器中看到几项专为 Looker 开发者设计的功能,具体取决于您的权限:
- 开发者可以通过所有字段和使用中标签页上的前往 LookML 选项找到“探索”的 LookML。
- 借助字段的 Info 图标菜单中的
sql
参数定义,开发者可以查看某个字段的sql
定义,而无需转到该字段的 LookML。 - 开发者可在字段的信息图标菜单中使用前往 LookML 选项,查看该字段的 LookML。
您可能还会在“探索”的数据表齿轮图标菜单中看到一些字段以及探索操作齿轮菜单中的几项功能:
- 某个字段的数据表齿轮菜单中的转到 LookML 选项可让 Looker 开发者找到该字段的 LookML 定义。
- 在“探索”的数据部分,使用 SQL 标签页可让 Looker 开发者查看 Looker 发送到数据库的 SQL 查询。
- 通过探索操作装备菜单中的获取 LookML 选项,开发者可以为“探索”的查询复制 LookML,此查询可用于向 LookML 信息中心添加卡片,利用汇总表格提高查询性能,或定义原生派生表。
总结
现在,您已经了解 Looker 探索页面在构建查询、显示结果以及通过迭代搜索发掘数据洞见方面的强大作用,不妨学习一下如何完成以下操作:
- 过滤并限制结果,使其仅显示您感兴趣的数据。
- 使用表格计算创建临时“探索”指标。
- 使用自定义字段创建临时维度和指标。
- 创建可视化图表。
- 将探索查询保存为 Looks 查询。
- 将“探索”查询添加到信息中心。
- 与其他用户共享数据。