建構行銷資料倉儲

本文說明如何從多個來源收集資料,建立之前無法使用的再行銷名單。您可以透過這些名單全面性地認識顧客。瞭解顧客與品牌互動的方式後,您就能提高效期價值 (LTV) 並獲得更深入的行銷深入分析。

行銷人員的角色已從傳統的行銷活動執行者進化為即時關聯互動者。資料擷取與回溯成效分析已是舊有的行銷模式,現今的行銷人員仰賴的行銷利器是以資料為基礎的顧客深入分析、績效導向策略,以及經過仔細規劃的主動式目標行銷。

這種全新的行銷方式也帶來了許多新的挑戰。舉例來說,價格日益低廉的儲存空間造成資料量大幅增長,不過將資料匯集至一處並進行分析仍是一大挑戰。其中牽涉以下複雜的因素:

  • 資料來源多且格式相異。
  • 太多不同的分析和擷取、轉換、載入 (ETL) 工具,導致實作困難。
  • 技術資源稀少。
  • 缺乏測試及製作原型的彈性。

本文將一一探討這些因素,並幫助您瞭解如何建立適合自己的資料工作流程。本文假設您具備結構化查詢語言 (SQL) 的基本知識。關於機器學習的部分,您可能需要資料分析師或數據資料學家的協助。

應用實例

本範例中的虛構公司是一家線上化妝品零售商,而您是這間公司的行銷長。您想要獲得重要的深入分析,但想盡量減少與開發運作團隊在技術層面的合作。您的 IT 資源有限,不過有數據資料學家從旁協助。

您的主要挑戰是透過追蹤廣告支出的投資報酬率 (ROI) 來充分運用行銷預算,不過您同時也面臨了以下的資料挑戰。

  • 資料分散在 Google Analytics 360、客戶關係管理 (CRM)、Campaign Manager 產品和其他來源上。
  • 顧客與銷售資料儲存在 CRM 系統中。
  • 部分資料的格式無法查詢。
  • 欠缺能與機構內其他部門共用結果的一般資料分析工具。

本文所述方法可幫您解決這些問題,並概略列出以下解決方案。

  • 將資料收集到共用的儲存位置。
  • 將資料轉換為可查詢且可跨來源合併的格式。
  • 獲得標準報告 API 無法提供的報告維度。
  • 利用機器學習工作探索使用者族群。

透過執行這些工作,您可以建立之前無法使用的再行銷名單。

架構

以下架構圖說明從擷取不同來源的資料到做出再行銷決策的過程。

從資料擷取到再行銷決策
圖 1:從擷取資料到做出再行銷決策。
  • 在此圖中,有些資料集的顏色較淺,表示其不屬於本文所述用途,不過您可以用相同的方法處理這些資料集。舉例來說,本文說明如何針對 Campaign Manager 資料進行 Google Ad Manager 或 YouTube 查詢,但您也可以對匯出到 BigQuery 的資料執行相同的作業。
  • 圖中包含一個標示「More advanced」(更多進階工作) 的部分。當您把資料整合到一個集中位置時,數據資料學家就能利用這些資料執行機器學習等更進階的工作。

功能需求

本節說明以下列功能需求為基礎的技術選項。

  • 收集和儲存資料
  • 轉換資料
  • 分析資料
  • 以視覺化方式顯示資料
  • 啟用資料

收集和儲存資料

獲得深入分析的第一步是將資料整合到一個集中位置。因此,請慎選所用技術,以協助您從最重要的行銷管道和資料來源 (從 Google 資料著手) 有效地收集資訊。

BigQuery 提供儲存功能和查詢引擎,能幫您從各種來源擷取資料。在本文中,您要收集與以下項目相關的資料:

  • Google 廣告BigQuery 資料移轉服務能夠從 Google Marketing Platform、Google Ads、YouTube 等來源自動且順暢地擷取資料。
  • Analytics 360:探索資料更新間隔選項 (從每 10 分鐘到每天更新),找出最符合您需求的選項。Analytics 360 可直接連線至 BigQuery。
  • 第一方資料:您可以從 CRM、銷售點 (POS) 等來源擷取資料。在大多數情況下,您可以使用 bq 指令列工具API網頁版 UI 在離線狀態下擷取資料。您可以從本機Cloud Storage 載入資料。如果資料集相當龐大,或是您考慮要建構資料湖泊,我們建議您使用 Cloud Storage。
資料收集流程
圖 2:收集及整合資料。

轉換

本節說明如何準備分析用的資料,相關工作包括清理及重新格式化作業,以維持龐大資料集的一致性。您希望分析師只要編寫少許程式碼或完全不用編寫程式碼,就能完成資料清理工作,像是透過可擴充且執行分散式轉換的視覺工具。

您可以使用 BigQuery 進行表格的批次轉換,或使用資料檢視功能。不過若要進行進階的轉換作業,您選用的視覺工具必須能透過複雜的處理管道執行數 TB 的資料,且幾乎不需要編寫程式。

假定您將一個鍵/值字串 (例如 Other_data 欄位) 匯出到 Campaign Manager 活動資料表

key1=value1&key2=value2&...keyN=valueN

您想要將這個字串拆分為類似以下資料欄和值組成的表格:

key1 | key2 | … | keyN
----------------------
val1 | val2 | … | valN

以資料欄形式顯示索引鍵名稱,有助於與其他現有表格合併。索引鍵可以包含自訂資訊,像是您的 CRM 使用者 ID、產品清單、Urchin 追蹤模組 (UTM) 資料等。

Cloud Dataprep by Trifacta 提供稱為「方案」的功能,可用來定義轉換。套件由在分散式環境背景中執行的一系列工作組成。

Cloud Dataprep 套件

定義套件時,Cloud Dataprep by Trifacta 可讓您預覽資料外觀。在下方的螢幕擷取畫面中,您會發現當系統儲存經過轉換的資料後,資料會包含處理方式 (treatments)、產品 (products)、疑慮 (concerns)、會員資格 (membership) 等新資料欄。

儲存經過轉換的資料

Cloud Dataprep by Trifacta 還支援各種不同的輸入及輸出來源 (包括 BigQuery),因此非常適合用於這個解決方案。Cloud Dataprep by Trifacta 能夠讀取從 Campaign Manager 匯入的 BigQuery 資料集,並將結果儲存回 BigQuery。

分析

集中儲存清理過的資料後,您就可以開始分析資料以獲取深入分析內容。將資料存放在 BigQuery 中有幾個優點:

  • 您可以查詢更龐大的資料,例如比 Google Ad Manager 報告 API 或 UI 能夠處理的資料量更龐大的資料也沒問題。
  • 您可以存取更精細的資料,UI 或報告 API 不一定能提供這些資料。
  • 您可以使用共同的索引鍵來處理及合併多個來源的資料。

本節後半段將說明您可以如何使用這些資料。本節分為兩部分:

  • 標準分析:您需要具備結構化查詢語言 (SQL) 的一些基本知識,這種分析主要著重於兩種類型的分析作業:

    • 「描述性分析」是指觀察貴公司正在發生的事情。
    • 「診斷性分析」是指瞭解發生的原因。
  • 機器學習式分析:您可能需要資料分析師或數據資料學家的輔助,這種分析可發展出新的分析方法,例如:

    • 「預測性分析」可利用歷史資料預測結果。
    • 「指示性分析」可用於預測結果和制定策略。

標準分析

廣告相關產品每天動輒會產生高達數 GB 或 TB 的記錄資料,這對分析工作是一大挑戰。現成的報告工具有時會限制可查詢的維度,提供並非全然正確的合併方法,或是根本無法查詢所有可用的原始資料,而只能提供匯總功能。

描述性和診斷性分析通常涉及探索工作,也就是對大數據進行查詢。這類工具需要有可擴充的架構,不過要以最少的基礎架構成本及合理的費用建構這種工具相當有挑戰性,尤其是在技術資源有限的情況下。其中一個解決方案就是使用 BigQuery。BigQuery 是儲存兼查詢引擎,能夠在短短幾秒內 (不用花上數分鐘或數小時) 執行數 TB 的資料查詢,而且完全不需要進行任何伺服器設定。

在 BigQuery 中執行查詢的最簡單方法是使用互動式 UI,但這個查詢資料頁面介紹的是其他做法。

進階分析和充實資料

如果您的技術功底較深厚或是您的團隊中有資料分析師或數據資料學家,您可以嘗試執行預測演算法,以取得對資料集有貢獻的額外知識。一些典型的工作包括:

  • 運用非監督式機器學習技術,將看起來類似的目標對象聚集在一起。
  • 使用迴歸分析法預測銷售數字或顧客效期價值。
  • 運用評論等資訊執行產品情緒分析。

雖然演算法對機器學習很重要,但預測準確度的關鍵是用於訓練模型的資料數量及品質。BigQuery 擷取資料後,您需要用到以下的資源:

  • 可將各種不同的 GCP 元件串連起來,以簡化數據資料工作的互動式工具。
  • 可用最少的開發運作人力執行大規模訓練及預測的機器學習平台。

AI Platform 能以代管且可擴充的方式執行訓練和預測用的 TensorFlow 模型,同時還新增了超參數調整等功能。TensorFlow 是最初由 Google 發佈的業界領先開放原始碼軟體 (OSS) 數值程式庫。

Cloud Datalab 提供 Jupyter Notebooks 服務,並加入了可與以下項目連線的功能:BigQueryCloud Storage、AI Platform 等 GCP 產品,或是 Cloud Natural Language 等 Perception API。數據資料學家可用 Cloud Datalab 執行互動式分析工作階段,並將所有這些產品的點串連起來。Cloud Datalab 還包含 NumPyPandas 等其他標準程式庫。

舉例來說,您可以透過 Cloud Datalab 使用 Natural Language 預測來進行一些情緒分析。直方圖顯示多數顧客對於產品、品牌或兩者都有正面的感受。

x = pd.Series(df.avg_sentiment, name="sentiment")
fig, ax = plt.subplots()
ax.set_title("Avg. Sentiment For All Products")
ax = sns.distplot(x, ax=ax)

情緒分析

將資料視覺化

您可能會發現在 BigQuery UI 中寫入 SQL 查詢或在 Notebook 中寫入 Python 程式碼相當麻煩。請思考以下情況:

  • 一位主管需要快速存取可操作的資訊主頁。
  • 一位分析師對於交叉和逐層分析資料的技術知識有限。

利用 Google 數據分析,您可以快速建立可共用的商務資訊主頁,不論是從頭開始建立或使用預先設定的範本。這種方式有幾個優點:

  • 能讓您透過拖曳功能存取資料。
  • 能促進協同合作以建立有意義的資訊主頁。
  • 能讓您與決策者共用預先建構的資訊主頁。

以下範例顯示來自幾個不同來源的資料。

  • 在左側的中間列,您可以看到 Google Analytics 360 報告,右側是 Campaign Manager。
  • 在最上列中間欄的藍點圖顯示顧客參與度與效期價值的對比關係。

顯示來自多個來源的資料

啟用資料

透過將原始資料儲存在共同的位置,利用程式碼和資訊主頁進行存取,並且置放在可操控資料的平台中,您可以做出許多行銷決策,例如:

  • 進行描述性分析,瞭解頻率如何影響每個廣告活動及每位使用者的轉換行為。 這類資訊可幫助您建立再行銷廣告活動,並按照特定使用者清單調整頻率。BigQuery 存取 Campaign Manager 原始資料的能力是取得這類資訊的關鍵。

  • 進行診斷性分析,瞭解廣告活動和網站行為對於銷售的影響。 如要活用這些分析,您可以使用 SQL 陳述式來建立大數據的 ID 集合。

  • 進行預測性分析,瞭解特定使用者的效期價值。 預測特定使用者群組的價值,據此進行行銷活動來提高銷售額。前面的藍點圖就是一個範例,您可能會從當中發現品牌參與度有限,但只要提高使用者參與度,購買潛力也會連帶提升的一群使用者。您可以透過合併資料以及運用機器學習,建立顧客區隔並預測效期價值金額,以獲得這項深入分析。

  • 針對產品情緒進行指示性分析。 透過分析文字評論和評分的變化,您可以預測特定使用者群組對於某種特性的產品的接受度,以避免目標鎖定不夠準確的情況。舉例來說,您可以利用情緒分析和顧客區隔法來執行這項工作。

後續步驟

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
解決方案