建立分支版本輸出

您可能需要從一組資料集中產生多個輸出以用於下游,例如:

  • 您想保有查看及及剖析來源資料的能力。詳情請參閱剖析您的來源資料一文。
  • 您需要透過疊加的資料產生不同的資料透視表。
  • 您需要篩選一組資料列或資料欄來提供給某個使用者社群,同時提供另一組資料欄給其他使用者社群。

重塑轉換

如果您的下一步是新增下列任一轉換,且您想保留現有資料以作他用,建議您在另外的專屬方案中新增這些步驟。

轉換名稱說明
聯集

聯集作業會將一或多個資料集附加到現有資料集。如要保留原始資料集,您可能需要建立分支版本輸出。請參閱聯集頁面一文。

彙整

彙整作業會根據兩個資料集中指定資料欄的共同值來合併資料集。這類轉換可大幅改變資料的形狀。請參閱彙整面板一文。

同樣地,查詢作業會使用來源資料中資料欄的值,從參照資料集提取對應資料列。這類轉換會在您的資料集中新增資料欄。請參閱新增查詢資料一文。

簡化這類轉換會移除資料集中的相同資料列。不過,您可能需要採取一組步驟來將不同資料欄中的值標準化,才能進行簡化作業。您可以選擇在分支版本方案中管理這個流程。
刪除欄資料欄經移除後,即無法再用於任何下游輸出。請參閱移除資料一文。
篩選您可以從資料集中篩選出特定資料列,藉此呈現不同的觀點。建議您將這類變更移至次要的分支版本方案。請參閱篩選資料一文。
透視資料當您建立資料透視表時,系統會將未在透視中明確指定的所有來源資料從資料集中捨棄。詳情請參閱透視資料一文。
分組依據您可以在資料表中執行匯總計算,但這樣可能會導致資料欄資料遭捨棄。請參閱建立匯總一文。


基本技巧

如果您要套用的轉換會破壞資料或重塑資料集,而您想保留資料集的目前狀態,請按照下列步驟操作:

  1. 在流程檢視中,選取您目前的方案,然後按一下 [新增方案]
  2. 這個方案會成為分支版本輸出的來源。請為新方案取一個適當的名稱,例如 Pivot-SalesPerProductPerStore
  3. 針對這個方案按一下「輸出」圖示,並為這個分支版本輸出指定所需輸出格式和輸出位置。
  4. 再次選取您目前的方案,然後按一下 [新增方案]
  5. 這個方案會成為目前方案的延伸版本。請為新方案取一個適當的名稱,例如,MyRecipe-Part2
  6. 選取 Pivot-SalesPerProductPerStore 方案,然後按一下 [編輯方案]
  7. 在這個方案中建構透視轉換。
  8. 準備完成後,請執行工作。系統應會以適當的格式和位置產生輸出。

圖:多個資料透視表的來源皆為流程主要方案的輸出。POS-r01-Part2 可用於持續疊加主要方案。

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁