数据可视化是指对汇编信息的任何直观表示。借助有效的数据可视化,您可以向受众群体传达关键主题和结果,让他们能够根据自己的需求解读和分析数据。在开始创建可视化图表和图表之前,您需要选择要使用的可视化图表类型。选择适当的可视化类型有助于您清晰、有效地呈现数据,让受众群体能够做出明智的决策并确定后续步骤。以下部分介绍了如何以注重分析目标和观众视角的方式有效地可视化数据:
考虑数据的特性
在确定可视化图表类型之前,请考虑数据的特性:
分类:如果您的数据包含一组类似的模式和集,则最好使用最适合分类数据的可视化图表类型,例如饼图。商品类别就是分类数据的一个例子,因为它会根据类似的功能和特征对商品进行分组。
有序:如果您的数据需要特定的排序顺序,您可以使用柱状图或条形图等可视化图表为受众群体定义这些顺序。例如,特定商品获得的不同星级评价的数量就是有序数据。
连续:如果您想直观呈现长时间内发生的数据,请使用支持连续数据的可视化图表,例如进度图。特定季度的总产品销售额就是持续数据的一个示例,因为系统会跟踪随时间推移而不断变化的数据。
定义受众群体
有效的可视化不仅要考虑数据,还要考虑受众群体的视角和需求。通过自定义可视化图表的外观,您可以向特定受众群体有效传达信息。在定义受众群体时,请考虑受众群体的预期技术知识水平和工作职能等因素。受众群体将如何使用您的可视化图表?
无障碍
创建数据可视化图表时,请确保其可供访问。在任何数据可视化项目中,考虑网站无障碍设计可以为所有用户(包括视觉和认知障碍用户)提供更多分享机会,让他们能够与您创建的内容互动。《网络内容无障碍指南》(WCAG) 包含适用于可视化设计的增强无障碍功能的实现步骤,包括:
替代文本:借助替代文本(也称为 alt 文本),更多用户(例如使用屏幕阅读器的用户)可以访问非文本元素中的信息。借助 Looker,您可以向可视化图表添加注释,以描述可视化图表的关键方面。如需详细了解如何向 Looker 可视化图表的元素添加文字说明,请参阅修改用户定义的信息中心文档页面上的关于修改功能块备注的信息。
对比度和颜色无障碍:采用符合 WCAG 国际标准的对比度级别,可确保可视化图表的观看者能够感知颜色选择的差异。如需查找两个所选十六进制颜色代码的对比度,请参阅 WebAIM 中的对比度检查工具。在 Looker 中,达尔顿色彩集合专门针对各种形式的色觉缺陷进行了调整。如需详细了解此集合以及 Looker 中的其他颜色选择选项,请参阅颜色集合文档页面。
如需详细了解创建可视化图表和其他内容时的无障碍功能,请参阅最新发布的网络内容无障碍指南。
为您的数据选择最佳可视化图表
以下部分简要介绍了 Looker 中提供的可视化图表类型,并讨论了如何为数据选择最佳类型:
笛卡尔图表
直角坐标图表是指基于直角坐标系的任何图表。直角坐标系由 x 轴和 y 轴定义,图表上的所有位置都有对应的数字点。所有直角坐标图表都会在这些轴上绘制数据。
x 轴和 y 轴反映的是维度和测量。维度反映的是定性值,而测量结果在本质上是定量值。这些值在 x 轴和 y 轴上的图表显示方式以及此类数据的可视化表达方式因直角坐标图类型而异。本部分包含以下直角坐标系图表示例:
列
最适合用于可比较的类别较少的数据的可视化。
柱状图是垂直坐标图,以垂直矩形的形式显示信息,其中柱子的长度与数据值相对应。典型的柱状图在 x 轴上显示数据类别,在 y 轴上显示数据值。
如果您的数据仅包含几个类别,则柱状图是理想之选。如果您的数据包含更多类别,柱状图通常更适合,因为它们为轴标签提供了更多空间。由于负值会向下显示,因此柱状图也是一种用于描绘包含负值的数据集的实用方式。
以下柱状图示例包含正值和负值,用于显示每月售出的配饰和牛仔裤的平均订单利润。
如需详细了解如何在 Looker 中创建这些图表,请参阅列图表选项文档页面。
条形图
最适合用于可视化类别标题较长的数据。
条形图与柱状图的显示方式类似,但通过水平对齐方式显示数据。通常,在条形图中,y 轴表示数据类别,而 x 轴表示数值。
如果您的数据包含特别长的类别标题,则条形图比柱状图更适合。通过在 Y 轴上对齐,条形图上的标签可优化空间并提高可读性。此外,与柱状图相比,条形图通常更适合表示更多类别,因为它可以对间距进行对齐。
以下条形图示例突出显示了较长的服装类别标题(例如“时尚连帽衫和卫衣”)如何在条形图对齐方式中显示。此图表显示了 10 个单独服装类别的每月订单量。
如需详细了解如何在 Looker 中创建条形图,请参阅条形图选项文档页面。
散点图
最适合突出显示两个变量之间的相关性。
散点图是一种直角坐标图,用于突出显示两个变量之间的关系。每个绘制的点都代表 x 轴和 y 轴上的值,可提供有关数据的数据分析。这类图表特别强调数据中出现的趋势和模式。
如果您的数据包含两个相关的变量,散点图可能是查找和探索相关性的理想可视化方法。这可能是正相关,这意味着当 x 变量增加时,y 变量也会增加。这还包括负相关,即当一个变量增加时,另一个变量会减少。相关系数也可以为 null,这表示所选的两个变量之间没有相关性。了解潜在的数据相关性有助于您深入了解数据,甚至可以指导预测未来的数据行为。
散点图的布局和结构是其有效性的关键。您还可以通过调整大小和颜色来自定义散点图上绘制的点,以便向查看者显示其他变量或类别。趋势线也可以与散点图搭配使用;这些线条会突出显示向观看者显示的数据之间的关联。通过自定义,确保这些设计选择突出显示说明关系的总体目标,并让用户有机会检查潜在的模式、相关性和趋势。
以下散点图显示了 2015 年至 2018 年期间每季度光顾某个地点的客户数量。图表中的数据点的大小取决于客户数量。
如需详细了解此类笛卡尔可视化图表,请参阅散点图表选项文档页面。
折线图
最适合可视化一段时间内的连续数据。
在折线图中,数据通过一系列由直线连接的点显示。此可视化图类型专门用于突出显示一段时间内的连续数据。
为了让线图清晰明了,线条数量仍然至关重要。如果您要在图表中添加多条线,请使用颜色来清晰区分这些线条。这样,观看者就可以分别解读这些值,而不是合并这些行。
以下折线图显示了 2016 年至 2019 年间的网站月活跃用户数。三条单独的线条代表美国的三个区域:东海岸、中西部和西海岸。
如需详细了解如何在 Looker 中创建折线图,请参阅折线图选项文档页面。
区
最适合直观呈现数量随时间的变化。
面积图基于其他笛卡尔图表(条形图和折线图)的特性构建而成。与折线图一样,面积图以线性形式突出显示一段时间内的连续数据。不过,这些图表使用类似于条形图的填充颜色功能,通过数据显示数量。这样,观看者就可以清楚地了解数量随时间的变化情况。
面积图用于传达整体趋势,而不是个别数据点。当您比较的趋势较少时,面积图会更合适,因为它包含填充颜色的区域组件。如需突出显示趋势较多的数据,不妨改用折线图。
以下面积图与折线图可视化示例类似,也显示了美国各个地区的网站月度用户数。不过,此图表中填充的颜色特别突出显示了 2018 年至 2019 年用户数量的变化。
如需详细了解 Looker 中的面积图,请参阅面积图选项文档页面。
饼图和圆环图
饼图和甜甜圈图可突出显示数据中各部分与整体之间的比例关系。因此,它们非常适合突出显示分类信息,即可以根据共享的特征明确划分为组的信息。
为了在饼图和甜甜圈图中更好地突出显示信息,请选择不超过五个类别。如果类别超过 5 个,不妨考虑选择其他可视化图表类型(例如条形图或柱状图)来突出显示信息。
由于饼图或甜甜圈图表示的是百分比,因此类别的值必须加起来为 100%。
Looker 提供两种饼图变体。本部分介绍了以下图表,并重点介绍了它们在显示分类数据方面的优势:
饼图
最适合直观呈现比例值。
饼图是指根据信息类别划分为多个扇形的完整圆形图表。通过这些 Slice 划分,重点不再是确切的百分比数值,而是概述的比例如何相互关联并影响图表的总体目标。
如果您想强调比例值之间的关联重要性,则可以使用饼图来有效传达这些关系。如果您要处理的数据类别超过 5 个,不妨考虑选择其他可视化图表来突出显示信息,例如条形图或柱状图。使用条形图和柱形图时,观看者通常更容易察觉个别差异。
以下饼图显示了来自美国三个地区(东海岸、西海岸和中西部)的客户总数所占的百分比。此可视化图表类型会显示每个地区的客户比例。
如需详细了解如何在 Looker 中创建这些对比图表,请参阅饼图选项文档页面。
多层环图
最适合可视化包含多个组件的比例值。
借助多圈饼图,您可以创建一系列饼图,以互联的形式直观呈现数据。这些图表会省略圆形的中心,形成弧形分隔而不是扇形分隔。图表中间新增的空白区域可用于添加更多数据标签和说明。
创建甜甜圈多个图表时,请确保各个类别的图案一致且协调,以突出显示它们之间的关系。此外,为确保清晰易懂且便于观看者理解,请在图表中心添加清晰的累计信息,以突出显示每个特定的甜甜圈多个图表的细微差别。
以下甜甜圈倍数图表显示了牛仔裤、紧身裤、外套和大衣以及短裤等多个类别的服装的季度商品销售情况。每个季度销售数据都有一个单独的甜甜圈图表。此可视化图表突出显示了各个服装类别(用统一的颜色表示)对每季度总产品销售额的贡献。
如需了解如何在 Looker 中添加甜甜圈多个图表,请参阅甜甜圈多个图表选项文档页面。
进度图
进度图会突出显示一段时间内显示的信息。通过这些图表,您可以突出显示此背景信息及其对数据的影响。进度图用于跟踪整体进度和增长情况。本部分包含以下进度图的示例:
漏斗图
最适合直观呈现顺序阶段。
漏斗图是突出显示顺序阶段的进度图。此类图表与条形图表相似,后者也通过水平矩形可视化结果来表示数据。此图表通过堆叠的直观化图表创建漏斗形状。
为了制作效果出色的漏斗图,请确保数据至少包含四个阶段。这将确保产生强烈的视觉冲击力,并突出显示整个流程。如果组件少于 4 个,不妨考虑使用其他类型的可视化图表,例如饼图。
以下漏斗可视化图表突出显示了客户操作的五个单独阶段以及每个阶段的百分比值。这些阶段依次为商品、购物车、购买、注册和取消,代表客户与商品的互动情况。
如需详细了解如何在 Looker 中创建此可视化图表,请参阅漏斗图表选项文档页面。
时间轴
最适合直观呈现时间的流逝。
时间轴图表会在指定时段内添加关键事件和标记,以突出显示时间的推移。虽然时间轴图表通常与时间相关,但此图表结构也可以应用于数字和金额。
通过自定义颜色,您可以在一个图表中使用多个时间轴,以显示多个因素在进展过程中的变化情况。对于时间轴图案(尤其是在 Looker 中),颜色自定义可能会因调色板而异。时间轴可以使用连续调色板,该调色板反映了在渐变色的任一部分都具有两个变量的渐变选项。您还可以使用分类调色板,即每种颜色代表数据中的一种类别。如需详细了解此颜色自定义和时间表图,请参阅时间表图选项文档页面。
以下时间轴可视化图表显示了 2022 年各个月份中特定订单 ID 及其相应的平均处理天数。时间轴使用连续的渐变调色板来表示不同的天数。
瀑布图
最适合可视化顺序正值和负值。
瀑布图通过序列突出显示正值和负值之间的关系。这些图表显示了初始价值如何因各种因素而演变。瀑布图会反映条形图的设计元素。与许多其他可视化图表类型一样,基于时间的标记或基于类别的标记可以构建广告瀑布流图,具体取决于您的特定数据集。
由于瀑布图专门用于处理正值和负值,因此必须明确区分这两类值。通过颜色使用和文本标签,确保可视化图表能够清晰区分数据中的值。
以下瀑布图示例显示了订购流程各个阶段(包括已取消、已退货、已发货和正在处理)的总收入。系统还会计算总金额。
如需详细了解此可视化图表类型,请参阅瀑布图选项文档页面。
文字和表格
如果您有有意义的文本数据要显示,选择文本和表格显示方式可以突出显示字词的影响。这些字词的显示方式可能有所不同,从突出显示单个值到在整个数据集中显示复杂的字词排列方式都有。本部分包含文本和表格可视化类型的众多示例:
单值图
最适合可视化单独的数据。
单值图表用于突出显示数据集中的单个值。以这种方式可视化值有助于突出显示其对更大数据集的重要性。
创建单值图时,请选择对受众群体有意义且反映您可视化目标的值。此外,请确保自定义字体系列和大小突出显示值,而不是分散用户注意力或缩小数据。
以下单值示例突出显示了来自加利福尼亚州的年客户数,即 118,126 人。
如需详细了解如何在 Looker 中自定义此图表,请参阅单值图表选项文档页面。
单记录图
最适合可视化有限的数据片段。
与单值图表类似,单记录图表也会突出显示较大数据集中的部分数据,以传达特定信息。不过,单个记录图表比单个值图表包含的信息更多。此可视化图表可以提供一个较大数据集的示例。
为此类图表选择有效且相关的单个记录,可突出显示数据集中的示例。您可以通过字体系列、字号和颜色使用情况来自定义此图表,以提高易读性和清晰度。
以下单条记录图表显示了特定商品“100% 真丝编织浅蓝和深蓝条纹领带”的关键信息。这包括商品 ID、类别和零售价。
如需详细了解如何在 Looker 中创建这些图表,请参阅“单个记录”图表选项文档页面。
词云图
最适合直观呈现数据频次。
词云是一种数据可视化图表,可通过自定义字体类型、大小和颜色来显示数据的频率。词云的关键结构是,在所分析的数据集中,特定字词的频率越高,字体大小就越大。即使观看者只是简单地瞥一眼或快速扫一眼,词云也能通过强烈的视觉冲击力传达数据集中的相关重复信息。
自定义间距以及水平和垂直对齐类型即可实现这种视觉效果。在某些词云中,创作者会按特定颜色对相似的主题词进行分组,以突出显示某些元素之间的关联性。这种按颜色对字词进行分组的方式还有助于为读者提供内容背景信息,帮助他们理解所提供的信息。
以下示例词云突出显示了客户所在的州/省/直辖市/自治区。各州名称的大小取决于每个州的客户数量,加利福尼亚州是客户数量最多的州。
如需了解 Looker 如何通过“样式”菜单选项专门助力直观地创建词云,请参阅“词云”图表选项文档页面。
地图
地图可视化图表会根据数据与位置的关系来呈现数据背景信息,因此如果您的数据与地理区域有明确关联,这种可视化图表类型会非常有用。您可以自定义可视化图表的地理范围,以便最准确地反映所收集的数据。这可能包括通过经度、纬度甚至邮政编码指定您的位置,具体取决于您的项目。
互动地图会根据自定义设置进行调整和重新配置,而静态地图在配置后会保持一致。本部分将重点介绍以下地理可视化图表:
Google 地图
最适合使用热图直观呈现地理数据。
Google 地图是 Google 的 Web 地图平台,可与受众群体互动地分享地理信息。借助 Looker 中的 Google 地图功能,您可以使用多种样式自定义地图的外观,例如浅色、深色、卫星、街道和户外。这些样式可以以不同的方式突出显示您的信息,具体取决于数据的范围和重点。此外,Google 地图可视化功能还支持热图实现。热图使用颜色编码系统显示信息,以指示数据频率。
以下 Google 地图热图可视化图表显示了美国各个邮政编码地区每月售出的产品数量。热图的范围为 9 到 66 件售出商品,从绿色到橙色逐渐过渡,表示此数值范围。您还可以使用键盘快捷键浏览此地图。
如需详细了解 Google 地图功能,请参阅 Google 地图图表选项文档页面。
地图
最适合可视化交互式地理数据。
互动式地图可视化图表会应用地理图像来表示数据与特定位置和区域之间的对应关系。交互式地图可以通过组合设计方面来反映许多其他可视化类型。这可能包括在可视化中使用点、线或区域来表示标记。
您还可以自定义整个地图的设计。具体而言,Looker 中的地图样式包括浅色、深色和卫星选项。每种选项都提供“无标签”功能。此设置会省略城市和街道名称等关键详细信息,以便更专注于数据,而不是地图的具体信息。选择地图设计时,请考虑用户需要考虑的重要细节,并选择最能反映这些细节的设计。
下图通过渐变颜色编码系统突出显示了美国各个邮政编码的用户数量。此互动式地图支持缩放功能,可让您重点查看地图上的特定区域。
如需详细了解 Looker 中的交互式地图,请参阅地图图表选项文档页面。
静态地图(区域)
最适合可视化区域数据。
按区域显示的静态地图会显示数据对特定区域的影响。由于地图是静态的,因此无法根据用户互动而发生变化或调整。这种可视化图表有助于描绘特定情况,而不是随着时间推移而变化的演变过程。
以下区域静态地图显示了美国各个州的商店数量。通过蓝色渐变,最深的蓝色表示店铺数量最多。此地图的这种颜色用法未量化;如需在各状态之间实现更强的对比度,可以启用样式菜单中的量化颜色开关。
如需详细了解 Looker 中的此类地图,请参阅静态地图(地区)图表选项文档页面。
静态地图(点)
最适合可视化地理点专用数据。
包含点的静态地图与包含区域的静态点类似。不过,这些地图通过跨区域重叠的点进行可视化。根据您要重点关注的数据,这种可视化类型可能会很有用,尤其是当数据集没有明显的地区划分时。
以下包含地图注点的静态地图包含按美国各个邮政编码中的客户数量调整大小的地图注点。
如需详细了解 Looker 中的此类地图,请参阅静态地图(点)图表选项文档页面。
其他图表
Looker 中还提供超出这些类别的其他热门数据可视化类型。这些额外的具体可视化形式可让您根据受众群体进行进一步的自定义,以便解读数据。本部分包含以下图表示例:
箱线图
最适合通过统计摘要直观呈现数据分布情况。
与散点图一样,箱形图也非常适合突出显示数据分布。箱形图通过统计摘要来显示这一点,或者通过观察和模式对数据进行分组。箱形图包含五项统计摘要,可根据最小值、最大值、样本中位数以及第一个和第三个四分位数对数据进行划分。箱形图的大小越大,表示数据的分布越大。
以下箱形图示例突出显示了 2021 年 1 月至 2022 年 7 月期间销售的商品的数据分布情况。将鼠标悬停在每个月数据条目上,系统会显示售出商品的最低、平均和最高数量。
如需详细了解箱形图以及如何在 Looker 中对其进行自定义,请参阅箱形图选项文档页面。
自定义可视化图表
除了 Looker 中提供的现有可视化图表之外,您还可以创建自定义可视化图表来显示数据。您可以通过以下方式实现自定义可视化图表:
- 在项目清单文件中添加自定义可视化,以便使用
visualization
参数创建自定义可视化 - 直接从 Looker Marketplace 安装可视化
- 在 Looker 的管理部分,从可视化图表页面安装可视化图表
可作为插件使用的自定义可视化图表示例包括日历热图可视化图表和 Aster 图可视化图表。如需详细了解自定义可视化图表的实现,请参阅“管理设置”-“可视化图表”文档页面。
此外,您还可以创建专属于您项目的可视化图表。如需详细了解如何创建这些可视化图表以及它们如何反映您的数据可视化目标,请参阅为 Looker Marketplace 开发自定义可视化图表文档页面。