貢獻分析總覽

請參閱本文,瞭解貢獻度分析的使用情境,以及在 BigQuery ML 中執行貢獻度分析的選項。

什麼是貢獻分析?

貢獻度分析 (也稱為主要因素分析) 是一種方法,可用於產生多維度資料中主要指標變化的洞察資料。舉例來說,您可以運用貢獻度分析,瞭解哪些資料導致兩個季度的收益數字出現變化,或是比較兩組訓練資料,瞭解 ML 模型效能的變化。

貢獻度分析是強化分析的一種形式,也就是運用人工智慧 (AI) 強化及自動化資料分析和解讀作業。貢獻分析可達成擴增分析的主要目標之一,也就是協助使用者找出資料模式。

使用 BigQuery ML 進行貢獻度分析

如要在 BigQuery ML 中使用貢獻度分析,請使用 CREATE MODEL 陳述式建立貢獻度分析模型。

貢獻度分析模型會比較測試資料集和控制資料集,偵測特定指標出現變化的資料區隔。舉例來說,您可以使用 2023 年底的銷售資料表快照做為測試資料,並使用 2022 年底的資料表快照做為控制資料,然後比較兩者,瞭解銷售額隨時間的變化。貢獻度分析模型可顯示哪些資料區隔 (例如特定地區的線上顧客) 帶動銷售額在一年內出現最大變化。

指標是貢獻度分析模型用來評估及比較測試和控制資料之間變化的數值。您可以使用貢獻度分析模型指定下列類型的指標:

  • 可加總: 加總您指定的指標資料欄值,然後為每個資料區隔判斷總計。
  • 可加總比率: 加總您指定的兩個數值資料欄的值,並判斷每個資料區段之間的比率。
  • 可依類別加總: 加總數值資料欄的值,然後除以類別資料欄中的不重複值數量。

區隔是資料的切片,由特定維度值組合識別。舉例來說,如果貢獻度分析模型是以 store_numbercustomer_idday 維度為依據,則這些維度值的每個不重複組合都代表一個區隔。下表中的每一列代表不同區隔:

store_number customer_id day
商店 1
商店 1 顧客 1
商店 1 顧客 1 星期一
商店 1 顧客 1 星期二
商店 1 顧客 2
商店 2

如要縮短模型建立時間,請指定先驗支援度門檻。先驗支援度門檻可讓您修剪較小且較不相關的區隔,模型只會使用最大且最相關的區隔。

建立貢獻度分析模型後,您可以使用 ML.GET_INSIGHTS 函式擷取模型計算的指標資訊。模型輸出內容包含多列洞察資料,每列洞察資料對應一個區隔,並提供該區隔的相應指標。

後續步驟