什么是流程挖掘?

流程挖掘是一种分析事件日志数据的技术,可帮助组织发现、监控和改进业务流程。它位于数据科学和流程管理的交叉点。通过使用专门的算法,流程挖掘可以读取企业资源规划 (ERP) 或客户关系管理 (CRM) 工具等系统中留下的数字足迹。它会获取此原始数据,并将其转化为业务流程的可视化地图。

开发者或企业领导者查看这些地图时,可以准确了解实时发生的情况。它超越了猜测或假设流程的运作方式。而是提供基于数据的客观情况。这有助于组织识别瓶颈、发现低效之处,并找到机会让运营更加顺畅。

流程挖掘的工作原理:从事件日志到分析洞见

流程挖掘技术通过从企业信息系统中已有的数据中提取知识来发挥作用。它遵循特定的工作流,将分散的数据转化为富有实用价值的分析洞见。

  • 注入:第一步是收集“事件日志”。用户每次与软件系统互动时,都会创建一条记录。此记录通常包含案例 ID(流程的特定实例,例如订单 #123)、时间戳(发生时间)和活动(发生的事情,例如“订单已批准”)。流程挖掘工具会提取此数据,作为分析的基础。
  • 发现:数据注入后,alpha 算法或归纳挖掘器等算法会重构流程。它们会查看每个案例的活动顺序,然后像 Looker 之类的软件会自动绘制流程图。此流程图直观呈现了不同案例的路径,显示了最常见的路线和离群值,且不带任何人为偏见。
  • 分析:最后,团队使用该软件来分析结果。他们会寻找“理想路径”,即流程应采取的理想、最高效的路线。然后,他们将其与偏差、循环或延迟进行比较,这有助于确定工作卡在哪里,或者团队在执行哪些额外的、不必要的步骤。

流程挖掘的类型

组织会根据自身目标使用三种主要流程挖掘技术。每种技术在理解和改进工作流方面都有不同的用途。

发现往往是起点。在此方法中,您仅使用事件日志数据从头开始构建模型。您无需从假设或预先存在的流程运作模型开始,因为算法只需查看数据并生成反映现实的模型。如果您想在没有任何先入之见的情况下了解实际情况,这会很有用。

一致性检查是将实际情况与标准进行比较。在此,您需要收集真实数据,并将其与预定义的“理想”模型或一组规则进行比较。目的是发现违规行为。例如,如果必须先批准采购订单才能支付账单,一致性检查就会标记出所有先付款后批准的情况。它有助于确保团队遵守规则。

增强是指使用数据来改进或扩展现有流程模型。这不仅仅是找出错误,而是要增加价值。例如,您可以获取现有的流程图,并叠加时间戳数据,以准确了解延迟发生的位置。这有助于您修复模型或调整流程,使其更好地适应业务环境的实际情况。

流程挖掘、数据挖掘和流程建模

这些术语很容易混淆,但它们指的是不同的学科。虽然他们都处理数据和业务分析,但他们解决问题的角度不同。

  • 流程建模传统上是一项手动任务。它依赖于业务分析师进行访谈、举办研讨会和使用便签来绘制流程的预期运作方式。它是主观的,代表“应该”的状态。
  • 数据挖掘是一个非常广泛的领域。它会寻找任何类型数据集中的模式,而不仅仅是流程数据。它可以帮助回答“哪些客户可能会流失?”之类的问题,而不是“为什么发货时间这么长?”
  • 流程挖掘 专门关注以流程为中心的数据,以直观呈现序列和流程。

功能

流程建模

数据挖掘

流程挖掘

主要来源

访谈、研讨会

大型数据集

事件日志(系统数据)

突出焦点

流程应如何运作

模式和相关性

流程的实际运作方式

客观性

主观(基于意见)

客观(基于事实)

目标

结果

静态图表

预测模型/集群

动态流程图

功能

流程建模

数据挖掘

流程挖掘

主要来源

访谈、研讨会

大型数据集

事件日志(系统数据)

突出焦点

流程应如何运作

模式和相关性

流程的实际运作方式

客观性

主观(基于意见)

客观(基于事实)

目标

结果

静态图表

预测模型/集群

动态流程图

流程挖掘的行业应用场景

流程挖掘应用涵盖各个行业。任何依赖结构化工作流的部门都可以使用这些技术来提高绩效。

财务部门通常是流程挖掘的首批采用者。他们可以利用流程挖掘来简化应付账款和应收账款流程,例如使用流程挖掘来帮助缩短账单处理周期。它有助于阻止重复付款,并防止未经批准的供应商(通常称为“特立独行的购买者”)进行采购。通过查看账单的确切流程,财务团队可以确保利用提前付款折扣并避免滞纳金。

对于经营实物商品的组织,流程挖掘可以帮助管理供应链的复杂性,例如通过确定哪些站点导致延迟来优化生产线。

在物流领域,它有助于直观呈现商品在供应链中的确切移动情况,从仓库到客户手中。这种可见性有助于管理者预测延迟情况,更顺利地管理库存交接,并确保生产计划与客户需求相匹配。

在医疗保健领域,流程挖掘可用于改善患者体验。医院可以使用它来直观呈现从入院到出院的“患者历程”。通过分析不同阶段(如分类、检查和治疗)之间的时间,管理员可以找出导致等待时间过长的瓶颈。这可以提高分类效率,确保将资源分配到最需要的地方,从而改善患者的治疗效果。

电信公司可以使用流程挖掘来改善客户服务和新客户入网体验。激活新线路或设置互联网服务的流程涉及许多步骤和部门。流程挖掘有助于识别客户流失的摩擦点。它可以揭示激活工单为何毫无进展或在技术部门和支持部门之间相互推诿,从而使公司能够解决根本问题并提高客户满意度。

AI 在流程挖掘中的作用

人工智能 (AI) 正在将流程挖掘从诊断工具转变为预测工具。传统流程挖掘分析的是过去发生的事情,而流程挖掘 AI 则使用机器学习来预测未来的结果。例如,模型可能会分析当前未解决的支持请求,并根据历史数据中发现的模式标记特定订单,预测“此订单将会延迟”。这使团队能够在问题实际发生之前进行干预。

生成式 AI 还让这项技术变得更加普及。无需数据科学家编写复杂的查询,用户本人就可以使用自然语言查询流程数据。经理只需问一句“显示柏林工厂的 3 大瓶颈”,系统就会生成分析结果。分析洞见的获取普及大众,非技术用户也能做出以数据为依据的决策。

流程挖掘对经营活动的益处

实施流程挖掘可以显著改进公司的运营方式。通过利用数据来推动决策,组织通常会获得明显的投资回报 (ROI)。

透明度

流程挖掘可提供近乎 100% 的运营可见性。因为它会查看系统中记录的每一笔交易,所以没有任何内容可以隐藏。领导可以了解不同部门和地点的工作流程实际情况,消除复杂运营的“黑箱”性质。

效率

这项技术擅长找出和消除瓶颈。例如,在供应链领域,它可能会揭示订单因需要手动签名而处于“待处理”状态三天。通过发现这些延迟,公司可以简化步骤,更快地将产品交付给客户。

合规性

它有助于检测违规行为,例如员工绕过标准采购流程的“特立独行采购”。它还会监控服务等级协议 (SLA) 违规情况,确保履行合同义务并降低受到处罚的风险。

自动化

流程挖掘是实现自动化的绝佳先导。它会识别哪些步骤是重复性的,并且足够稳定,可以由机器人流程自动化 (RPA) 来处理。企业不再猜测要自动化哪些流程,而是使用数据来选择能够带来最高效率提升的流程。

利用 Google Cloud 解决业务难题

新客户可获得 $300 赠金,用于抵扣 Google Cloud 的费用。

构建流程挖掘流水线示例

对于开发者来说,流程挖掘不仅仅是查看信息中心,而是构建数据流水线,从而获得这些分析洞见。下面是一个实际示例,说明了如何使用 Google Cloud 设计解决方案来优化电子商务订单系统。

  • 第 1 步:集中管理日志。您的首要任务是将原始数据从应用中提取出来,然后放入可供分析的位置。您可以将(在 Google Kubernetes EngineCompute Engine 上运行的)电子商务应用配置为将应用日志发送到 Cloud Logging。然后,创建一个“接收器”,将这些日志自动导出到 BigQuery。这可确保每个“已下单”“已处理付款”和“已发货”事件都永久存储在可扩缩的数据仓库中。
  • 第 2 步:将数据转换为事件日志。原始应用日志通常是杂乱的 JSON Blob。您需要将这些数据转换为清理后的“事件日志”格式,以便于流程挖掘算法读取。您可以使用 BigQuery SQLDataform 来编写转换流水线。此流水线提取了三个关键列:支持请求 ID(订单号)、时间戳(事件发生时间)和活动名称(例如“已批准付款”)。
  • 第 3 步:使用 AI 预测结果。清理后的事件日志表进入 BigQuery 后,您可以使用 Vertex AI 添加预测性智能。您可以直接使用 BigQuery 数据训练表格分类模型,以预测二元结果,例如“此订单是否会延迟?(是/否)。”然后,您可以将这些预测结果写回 BigQuery,用未来的概率丰富您的流程数据。
  • 第 4 步:直观呈现和提醒。最后,您可以将 Looker 连接到 BigQuery 表,以直观呈现流程和预测的延迟时间。您还可以设置一个 Cloud Run 函数,每当 Vertex AI 预测到送货延迟的可能性较高时,该函数就会触发向客户支持团队发送提醒,以便他们主动联系客户。

其他资源

详细了解支持流程挖掘的概念、数据基础和 Google Cloud 技术。

立即行动

获享 $300 赠金以及 20 多种提供“始终免费”用量的产品,开始在 Google Cloud 上构建项目。