範例 - LIST 與 LISTUNIQUE 函式

此範例說明下列函式:

  • LIST - 將單一資料欄的值 (最多 1000 個) 擷取至新資料欄中的陣列。請參閱 LIST 函式
  • LISTUNIQUE - 將單一資料欄的值 (最多 1000 個且不重複) 擷取至新資料欄的陣列中。請參閱 UNIQUE 函式一文。

您有下列一組兩個月的訂單,並想要辨認每個月每項產品售出的顏色集合,以及每個月銷售產品的總數量。

來源:

OrderIdDateItemQtyColor
10011/15/15Pants1red
10021/15/15Shirt2green
10031/15/15Hat3blue
10041/16/15Shirt4yellow
10051/16/15Hat5red
10061/20/15Pants6green
10071/15/15Hat7blue
10084/15/15Shirt8yellow
10094/15/15Shoes9brown
10104/16/15Pants1red
10114/16/15Hat2green
10124/16/15Shirt3blue
10134/20/15Shoes4black
10144/20/15Hat5blue
10154/20/15Pants6black

轉換:

若依照月份追蹤,您的資料欄必須含有從日期中擷取的月份值:

set col:Date value:DATEFORMAT(Date, 'MMM yyyy')

您可使用下列轉換指令,檢查各顏色間的不重複值清單:

pivot value: LISTUNIQUE(Color, 1000) group: Date limit:10

日期listunique_Color
Jan 2015["green","blue","red","yellow"]
Apr 2015["brown","blue","red","yellow","black","green"]

刪除以上的轉換指令。

您可以在資料集裡匯總資料,並按格式重新設定後的 Date 值分組,然後將 LIST 函式套用到 Color 資料欄。在同一個匯總作業中,您也可以在 Qty 資料欄加入總和函式:

pivot value: LIST(Color, 1000) SUM(Qty) group: Date limit:10

結果:

Datelist_Colorsum_Qty
Jan 2015["green","blue","blue","red","green","red","yellow"]28
Apr 2015["brown","blue","red","yellow","black","blue","black","green"]38

必要時,您可以使用下列指令拆分清單陣列資料:

unnest col:list_Color

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁