データをフィルタする

このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときにフィルタする方法について説明します。Wrangler では、ブール値型を除く任意のデータ型の列でデータの行をフィルタできます。構成した条件に基づいて行を維持または削除します。

条件に基づいて行を維持または削除する手順は次のとおりです。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
  3. [フィルタ] を選択し、[行を維持] や [If value contains] などのオプションを選択します。
  4. 条件を指定します。
  5. [適用] をクリックします。

値はフィルタに応じて変化します。Wrangler は、filter-rows-on ディレクティブをレシピに追加します。データ パイプラインを実行すると、列の値に変換が適用されます。

行を維持

条件に基づいて行を維持する場合、条件を満たさない行は削除されます。条件を満たす行のみがデータセットに残ります。たとえば、[value is] を選択し、条件 Customer を入力すると、Wrangler は文字列 Customer を含む行を維持し、他の値を含む行を削除します。

行を削除する

条件に基づいて行を削除する場合、条件を満たす行がデータセットから削除されます。たとえば、行を削除して [value is empty] を選択すると、Wrangler は空の値または null 値を持つ列から行を削除します。

サポートされているフィルタ条件

行は次の条件に基づいてフィルタできます。

条件 説明
value is empty 空の値を含む値を維持または削除します。
value is 指定された値と完全に一致する値を維持または削除します。文字列データ型を含む列の場合は、大文字と小文字を区別しないように選択できます。デフォルトでは、条件に大文字と小文字を含みます。
value contains 指定された値を含む値を維持または削除します。
value starts with 指定された値で始まる値を維持または削除します。
value ends with 指定された値で終わる値を維持または削除します。
matches regex 正規表現に一致する値を維持または削除します。
custom condition カスタム条件に一致する値を維持または削除します。

次のステップ