篩選資料

本頁面說明如何在 Cloud Data Fusion Studio 的 Wrangler 工作區中準備資料時進行篩選。在 Wrangler 中,您可以篩選任何資料類型 (布林值類型除外) 的資料欄中的資料列。您可以根據所設定的條件保留或移除資料列。

如要根據條件保留或移除資料列,請按照下列步驟操作:

  1. 前往 Cloud Data Fusion 中的 Wrangler 工作區
  2. 在「資料」分頁中,前往所需欄名,然後按一下展開箭頭 arrow_drop_down
  3. 選取「篩選器」,然後選取所需選項,例如「保留資料列」和「如果值包含」
  4. 指定條件。
  5. 按一下 [套用]

這些值會因篩選器而異。Wrangler 會將 filter-rows-on 指令加入至食譜。執行資料管道時,系統會將轉換套用至資料欄中的值。

保留資料列

如果您選擇依據條件保留資料列,系統會移除不符合條件的資料列。資料集中只會保留符合條件的資料列。舉例來說,如果您選取「value is」並輸入條件 Customer,Wrangler 會保留含有字串 Customer 的資料列,並移除其他值的資料列。

移除資料列

如果您選擇依據條件移除資料列,系統會從資料集中移除符合條件的資料列。舉例來說,如果您移除資料列並選取「值為空白」,Wrangler 就會從資料欄移除含有空白或空值的資料列。

支援的篩選條件

您可以根據下列條件篩選資料列:

條件 說明
值為空白 保留或移除含有空白值的值。
值為 保留或移除含有確切指定值的值。對於包含字串資料類型的資料欄,您可以選擇忽略大小寫。預設會在條件中加入大小寫。
value contains 保留或移除包含指定值的值。
值開頭為 保留或移除以指定值開頭的值。
值結尾為 保留或移除以指定值結尾的值。
與規則運算式相符 保留或移除符合規則運算式的值。
自訂條件 保留或移除符合自訂條件的值。

後續步驟