彙整類型

以下為支援的彙整類型。舉例來說,下列的資料表包含員工和部門的相關資訊。

員工資料表:

NameDepartmentIDRole
Dave Smith001Product Marketing Manager
Julie Jones002Software Engineer
Scott Tanner001Director of Demand Gen
Ted Connors002Software Engineer
Margaret Lane001VP of Marketing
Mary Martin004Receptionist

部門資料表:

NameDepartmentID
Marketing001
Engineering002
Accounting003

在上述範例中,DepartmentID 是在兩個資料表中用來執行任一彙整類型的索引鍵。

內部彙整

內部彙整需要兩個資料表都有的鍵值,才能在結果資料表中顯示記錄。只有在兩個資料表中都有相符的鍵值時,合併結果才會出現記錄。

  • 如果您要加入包含不相符值的資料列,必須使用某些外部彙整的形式。請見以下說明。

在上述的資料表範例中,對 DepartmentID 資料表執行內部彙整會產生下面的結果資料表:

Employee.NameEmployee.DepartmentIDEmployee.RoleDepartment.NameDepartment.DepartmentID
Dave Smith001Product Marketing ManagerMarketing001
Julie Jones002Software EngineerEngineering002
Scott Tanner001Director of Demand GenMarketing001
Ted Connors002Software EngineerEngineering002
Margaret Lane001VP of MarketingMarketing001

注意事項:

  • 所有欄位都會併入合併的結果集。系統會先列出第一個資料集中的欄位。
  • 由於部門資料表中沒有 Mary Martin 所屬部門 ID 的資料,因此結果中並沒有包含 Mary Martin 的資料列。Accounting 的資料列也因為員工資料表中沒有該部門 ID 的資料而遭到排除。
    • 如要加入這些資料列,您必須擴增資料或執行任一形式的外部彙整。
  • 其中一個資料表中的空值並不符合另一資料表中的空值。所以在彙整鍵中,含有空值的資料列永遠不會併入內部彙整之中。這些值應為固定值。

    提示:內部彙整可用來刪除索引鍵欄位中含有空值的資料列。

左彙整

左彙整 (或左外部彙整) 不需要來源 (左) 資料表鍵值中的每個值都有相符的記錄。不論在右資料表中是否有相符項目,左資料表中的每一個資料列都會出現在結果中。

在上述的資料表範例中,對 DepartmentID 資料表執行左彙整會產生下列的結果資料表:

Employee.NameEmployee.DepartmentIDEmployee.RoleDepartment.NameDepartment.DepartmentID
Dave Smith001Product Marketing ManagerMarketing001
Julie Jones002Software EngineerEngineering002
Scott Tanner001Director of Demand GenMarketing001
Ted Connors002Software EngineerEngineering002
Margaret Lane001VP of MarketingMarketing001
Mary Martin004ReceptionistNULLNULL

注意事項:

  • 由於 Mary Martin 在員工資料表中的記錄具有 DepartmentID 的項目,因此 Mary Martin 資料列在左彙整中會加入結果資料表。然而,因為在部門資料表中沒有任何對應值,結果資料表中的對應欄位為 NULL 值。

右彙整

右彙整 (或右外部彙整) 是左彙整的相反。右彙整不需要次要 (右) 資料表鍵值中的每個值都有相符的記錄。不論在左資料表中是否有相符項目,右資料表中的每一個資料列都會出現在結果中。

在上述的資料表範例中,對 DepartmentID 資料表執行右彙整會產生下列的結果資料表:

Employee.NameEmployee.DepartmentIDEmployee.RoleDepartment.NameDepartment.DepartmentID
Dave Smith001Product Marketing ManagerMarketing001
Julie Jones002Software EngineerEngineering002
Scott Tanner001Director of Demand GenMarketing001
Ted Connors002Software EngineerEngineering002
Margaret Lane001VP of MarketingMarketing001
NULLNULLNULLAccounting003

注意事項:

  • 在這個右彙整中,系統新增了 Accounting 項目。然而,由於在員工資料表中沒有任何該 DepartmentID 值的項目,因此那些欄位在結果集中均為 NULL 值。

完整外部彙整

完整外部彙整結合左彙整和右彙整的效果。如果鍵值之間具有相符項目,即會在結果中寫入該資料列。

  • 如果其中一個資料表的鍵值沒有任何相符項目,則會在結果中寫入單一記錄,系統會在另一資料表的欄位中插入 NULL 值。
Employee.NameEmployee.DepartmentIDEmployee.RoleDepartment.NameDepartment.DepartmentID
Dave Smith001Product Marketing ManagerMarketing001
Julie Jones002Software EngineerEngineering002
Scott Tanner001Director of Demand GenMarketing001
Ted Connors002Software EngineerEngineering002
Margaret Lane001VP of MarketingMarketing001
Mary Martin004ReceptionistNULLNULL
NULLNULLNULLAccounting003

注意事項:

  • 從左到右及從右到左的彙整中,任何重複的資料列均會從結果中移除。

交叉彙整

交叉彙整會將第一個資料集的每一個資料列與第二個資料集的每一個資料列合併,並在輸出內容中顯示每一種組合。因此,彙整中的資料列數量總共為:

Rows(DatasetA) * Rows(DatasetB)

附註:依據資料集大小而定,交叉彙整可能會大幅增加輸出內容的大小,並在某些環境中造成費用增加。

相互彙整

下圖概略說明支援的彙整類型之間的關係。在每一個文氏圖中,交集區域是包含共用鍵值的記錄集合。

圖片:彙整類型

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁