預測分析是使用資料來預測未來結果的過程。這個程序會使用資料分析、機器學習、人工智慧和統計模型,找出可能預測未來行為的模式。機構可以使用歷來和目前的資料,以極高的精確度預測未來幾秒、幾天或幾年內的趨勢和行為。
建構預測分析架構的工作流程分為以下五個基本步驟:
一般而言,預測分析模型分為兩種類型:分類和迴歸模型。分類模型會嘗試將資料物件 (例如客戶或可能結果) 歸入特定類別。舉例來說,如果零售商收集了許多不同類型客戶的資料,就能嘗試預測哪些類型的客戶對市場研究電子郵件感興趣。迴歸模型會嘗試預測連續資料,例如客戶與公司維持關係期間可產生多少收益。
預測分析通常會透過三種主要類型的技巧來執行:
迴歸分析
迴歸是一種統計分析技巧,可估算變數之間的關係。迴歸適合用來辨識大型資料集中的特定模式,藉此判斷輸入資料之間的關聯性,最適合用於遵循已知分佈模式的連續資料。迴歸通常用於確定一或多個自變數對其他變數的影響,例如價格調漲對產品銷售量有何影響。
決策樹狀圖
決策樹是分類模型,可根據不同的變數將資料歸入不同的類別。這種方法最適合用來瞭解個人的決定。這種模型看起來像是一個樹狀結構,每個分支代表一個可能的選項,而分支的葉片則代表決策結果。一般來說,如果資料集缺少幾個變數,決策樹狀圖通常較容易理解且成效良好。
類神經網路
類神經網路是一種機器學習方法,非常適合在模擬非常複雜的關係時,用於預測分析。基本上,這些模型就是模式識別的驅動引擎。類神經網路最適合用來判斷資料集內的非線性關係,特別是在沒有已知的數學公式可以分析資料時非常實用。類神經網路可用於驗證決策樹和迴歸模型的結果。
預測分析可用於簡化作業流程、提高收益及降低風險,幾乎任何企業或產業都適用,包括銀行業、零售業、公用事業、公部門、醫療照護產業和製造業。在某些情況下也會使用擴增分析,這種分析方法採用的是大數據機器學習技術。以下提供幾個用途示例,包括 data lake 分析。
詐欺偵測
預測分析會即時檢查公司網路上的所有活動,找出可能代表有詐欺行為和其他安全漏洞的異常之處。
轉換和購買預測
如果預測資料顯示出在特定情境下或特定族群的轉換機率或購買意願較高,公司便可據以採取行動,像是將舊訪客指定為線上廣告的目標對象。
風險降低
信用評分、保險理賠和債務催收皆使用預測分析來評估及判斷未來違約的發生機率。
營運改善
公司使用預測分析模型來預測庫存、管理資源,並提高營運效率。
客戶區隔
藉由將客戶群劃分成特定群組,行銷人員就能利用預測分析,做出具前瞻性的決策,以針對不同的目標對象提供量身打造的內容。
維護預測
機構可使用資料來預測日常設備何時會需要維護,以便在問題發生之前或故障之前排定維護時間。