混合提示和進階概念

本文提供資料混合的建議和深入資訊,協助您瞭解混合的運作方式,並解決複雜的用途。如要充分瞭解本文,您應已熟悉資料混合的基本概念,這部分內容已在本主題的其他文章中說明。

混搭資料應只包含部分可用資料

最佳做法是只在以混合資料為基礎的圖表中,加入要顯示的特定欄位。這項功能的重要性:

  • 混搭功能可能會建立非常龐大的資料集,導致效能降低,並可能提高 BigQuery 等付費服務的查詢費用。
  • 以混合為基礎的圖表會計算混合中的所有資料列,即使這些資料列未在圖表中使用亦然。
    • 舉例來說,假設您建立的混合資料包含 10 個欄位。接著,定義只使用其中一個欄位的圖表。Looker Studio 會計算 10 個欄位的混合資料,然後查詢混合資料輸出內容中的 1 個欄位,藉此建立圖表。
    • 只有在混搭資料包含基礎資料的子集時,才會重新彙整。

使用混合功能重新匯總指標

您從基礎資料來源納入的指標,在混合資料中會變成未經匯總的數字。如果混搭包含的欄位少於基礎資料來源的完整欄位集,系統會根據新資料重新彙整這些數字。如果需要對已匯總的欄位套用不同的匯總,例如計算平均值的平均值,這種方式的資料混合就很有用。

詳情請參閱「使用混合功能重新彙整資料」。

從單一資料來源建立混合資料

混搭不一定要使用不同的資料來源。您也可以混合來自相同資料來源的多個資料表,重新匯總資料。

舉例來說,假設您有一個資料集,其中包含美國人口最多的前三個郡的人口資料,如下表所示:

人口數 (2023 年估計)

加州

洛杉磯郡

10,014,009

加州

聖地牙哥郡

3,298,634

加州

橘郡

3,186,989

德州

哈里斯郡

4,731,145

德州

達拉斯郡

2,613,539

德州

塔蘭特郡

2,110,640

紐約州

金斯郡 (布魯克林)

2,736,074

紐約州

皇后區

2,405,464

紐約州

布朗克斯郡

1,418,890

您想計算州內每個郡的人口百分比,但為此需要將每個州的人口總數做為獨立欄位。資料集中沒有這項指標,但您可以將人口資料來源與自身混合,藉此取得這項指標,方法如下:

  1. 使用基礎資料集建立資料來源。
  2. 將使用該資料來源的圖表新增至報表。
  3. 使用兩個資料表建立混合資料。每個資料表都會使用您在步驟 1 中建立的相同資料來源。
    1. 針對表 1,請加入下列欄位:
      1. 州/省縣/市人口
      2. 將「Population」重新命名為「CountyPopulation」
    2. 針對資料表 2,只納入「Population」(人口) 欄位,並將該欄位重新命名為「StatePopulation」(州人口)
  4. 彙整條件請使用「Left Outer」(左外部) 彙整,將資料表 1 中的「State」(州) 連結至資料表 2 中的「State」(州)
  5. 按一下 [儲存]
  6. 按一下「X」X返回報表編輯器。

接著,在報表中新增圖表 (例如表格),然後按照下列步驟,選取資料混合做為圖表的資料來源:

  1. 在圖表中新增「State」(州)、「County」(郡)、「CountyPopulation」(郡人口) 和「StatePopulation」(州人口) 欄位。
  2. 如要計算每個縣市的州人口百分比,請在圖表中新增計算結果欄位,並使用重新彙整的新資料:
    1. 在「屬性」面板中,依序點選「新增指標」和「新增欄位」
    2. 為欄位命名 (例如「州人口百分比」)。
    3. 在「公式」方塊中輸入 (CountyPopulation / StatePopulation)*100
    4. (選用) 設定「顯示格式」,以顯示特定精確度的百分比值 (例如「百分比 (2)」表示顯示兩位小數)。

完成後,表格應如下所示:

CountyPopulation

StatePopulation

州人口百分比

加州

洛杉磯郡

10014009

16499632

60.69

德州

哈里斯郡

4731145

9455324

50.04

加州

聖地牙哥郡

3298634

16499632

19.99

加州

橘郡

3186989

16499632

19.32

紐約州

金斯郡 (布魯克林)

2736074

6560428

41.71

德州

達拉斯郡

2613539

9455324

27.64

紐約州

皇后區

2405464

6560428

36.67

德州

塔蘭特郡

2110640

9455324

22.32

紐約州

布朗克斯郡

1418890

6560428

21.63

混合中的表格順序

Looker Studio 會依序評估混搭中的聯結設定,從最左側的設定開始。然後,每個聯結的結果會套用至右側的下一個聯結。舉例來說,在三個資料表的混合中,系統會評估資料表 1 (最左側) 和資料表 2 (中間) 之間的聯結設定,然後資料表 2 和資料表 3 (最右側) 之間的聯結設定會使用這些結果。

自動建立的混合資料表中的資料表順序

混合選取的圖表時,Looker Studio 會為每個圖表建立資料表,然後將圖表中的欄位新增至對應的資料表。混搭中的表格順序與您選取圖表的順序一致:第一個選取的圖表會成為第一個 (最左側) 表格,第二個選取的圖表會成為第二個表格,依此類推。

Looker Studio 也會自動為每個資料表建立聯結設定,並使用左外部聯結類型。

如果預設設定不符合需求,或資料表之間沒有明確的連結,您可以編輯混合資料,以符合目標。

表格是在混合前建立

系統會先查詢混合中每個資料表的資料,再將這些資料併入最終混合。系統會先將資料表中的日期範圍、篩選器和計算欄位套用至產生資料表的查詢,再執行任何聯結。這些因素可能會影響混合資料表所含的資料,並改變混合結果。

混搭資料可能比原始資料多出更多列

與根據組成混合資料的個別資料來源建立的圖表相比,混合圖表可能會顯示更多資料。結果取決於您的資料,以及為混合資料選擇的聯結設定。舉例來說,左外部聯結會納入左側資料表的所有記錄,以及右側資料表中與聯結條件共用相同值的所有記錄。如果彙整條件有多個相符項目,彙整資料中的資料列可能會比最左側資料來源中的資料列還多。

混合和明確的日期範圍和篩選條件

如要限制混合資料中的列數,可以使用日期範圍或套用篩選器。您可以限制以混合資料為基礎的圖表,或組成混合資料的表格中的資料列。建議將這個程序視為「混合前」或「混合後」。

如果您對混合資料中的表格套用日期範圍或篩選器,系統會先套用這些設定,再將資料與混合資料中的其他表格合併。如果資料列超出日期範圍或遭篩選器排除,聯結查詢就無法處理。

如果根據混合資料對圖表套用日期範圍或篩選器,系統會對混合資料建立「後」的資料套用這些設定。

視資料和混合設定而定,這項差異可能會對圖表中的結果造成重大影響。

混合和沿用篩選器

只要篩選條件與前融合或後融合資料相容,融合就會沿用報表、網頁或群組層級的篩選條件。如果篩選器與混合使用的基礎資料來源相容,篩選器就會對混合前資料套用篩選條件。否則,篩選條件會套用至混合後的資料。如果篩選器與前融合或後融合資料不相容,系統會忽略該篩選器。

進一步瞭解篩選器沿用

如果圖表是以混合資料為基礎,且受到繼承篩選器限制,Looker Studio 會依下列五個步驟處理資料:

(前置混合)

  • 步驟 1:系統會根據「混合資料」面板中指定的維度,將資料分組並彙整。
  • 步驟 2:系統會將沿用的維度篩選器和相容的指標篩選器,套用至「混合資料」面板中包含的資料來源。

(混合)

  • 步驟 3:系統會使用指定的聯結設定來混合資料。

(混合後)

  • 步驟 4:系統會根據圖表中的維度,將資料分組並匯總。
  • 步驟 5:如果指標篩選器與混合資料相容,系統會將篩選器套用至圖表。