串流分析是指連續處理及分析資料記錄,這與分批形式不同。一般而言,如果來源產生的資料是以小單位持續傳輸 (通常是 KB),串流分析就能派上用場。
瞭解 Google Cloud 的串流和批次資料處理整合服務 Dataflow。
串流數據分析可包括各種資料來源,例如:來自連線裝置的遙測、客戶使用網頁應用程式產生的記錄檔案、電子商務交易或來自社群網路或地理空間服務的資訊。串流數據分析通常用於即時匯總和關聯、篩選或採樣。
傳統上,資料是按批次移動的。批次處理通常會同時處理大量資料,所以延遲時間較長。例如,一個流程可能每 24 小時執行一次。雖然這可能是處理大量資料的有效方法,但這並不適用於具時效性且需要串流處理的資料,因為這些資料在處理時可能已經過時。
當公司每秒收集多達數十萬甚至數百萬個事件的資料時,資料集必然十分龐大。傳統系統可能需要幾天的時間,才能從如此大規模的資料中獲得深入分析結果。
如要即時採取行動,您將需要進行即時資料處理和分析。這時採用適合的資料串流平台和基礎架構,即可實現目的。例如,在 Google Cloud 產品和服務上建構的串流分析,就能讓公司即時擷取、處理和分析資料串流。
公司可以使用串流分析來即時分析資料,並提供對各種活動的深入分析結果,例如計量、伺服器活動、裝置的地理位置或網站點擊次數。可能的用途包括:
電子商務
分析使用者點擊流,透過即時定價、促銷和庫存管理來達成購物體驗最佳化。
金融服務
分析帳戶活動,偵測資料串流中的異常行為,並為異常行為產生安全快訊。
投資服務
追蹤市場變化,並根據已設定的限制條件 (例如到達某個股價時賣出),調整客戶投資組合的設定。
新聞媒體
對來自各種新聞來源平台的使用者點擊記錄進行串流分析,並透過受眾特徵資訊充實資料,以提供與目標受眾更為相關的報導。
公用程式
監控整個電網的總處理量,並在到達設定的門檻值時產生快訊或啟動相關工作流程。