範例 - Flatten 與 Valuestocols 轉換

此範例示範如何使用下列轉換指令,建立資料欄的交互參照:

  • flatten:將陣列中的值整併成資料集的個別資料列。請參閱 Flatten 轉換一文。
  • valuestocols:將不重複的值例項擷取到個別資料欄,並在出現不重複值的每一列中加入指標。請參閱 Valuestocols 轉換一文。

來源:

以下為個別客戶的雜誌訂閱資料。訂閱資料是以值的陣列儲存。您想知道每一種雜誌的訂閱客戶是誰。

CustIdSubscriptions
Anne Aimes["Little House and Garden","Sporty Pants","Life on the Range"]
Barry Barnes["Sporty Pants","Investing Smart"]
Cindy Compton["Cakes n Pies","Powerlifting Plus","Running Days"]
Darryl Diaz["Investing Smart","Cakes n Pies"]

轉換:

將此資料載入「轉換」頁面時,您可能需要將 header 套用於此資料。如果資料採用 CSV 格式,您可能需要套用一些 replace 轉換指令來清理 Subscriptions 資料欄,以便能如上述範例所示。

Subscriptions 資料欄含有乾淨格式的陣列時,資料欄的類型會重設為陣列類型。您可以接著套用 flatten 轉換指令:

flatten col:Subscriptions

系統現在會將每個 CustId/Subscription 組合寫入個別資料列。您可以使用這個新的資料結構來細分雜誌訂閱資料的例項。您可以使用下列轉換指令,在資料欄中新增對應的 CustId 值:

valuestocols col:Subscriptions value:CustId

刪除兩個來源資料欄:

drop col:CustId,Subscriptions

結果:

Little_House_and_GardenSporty_PantsLife_on_the_RangeInvesting_SmartCakes_n_PiesPowerlifting_PlusRunning_Days
Anne Aimes
Anne Aimes
Anne Aimes
Barry Barnes
Barry Barnes
Cindy Compton
Cindy Compton
Cindy Compton
Darryl Diaz
Darry Diaz
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁