このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときにフィルタする方法について説明します。Wrangler では、ブール値型を除く任意のデータ型の列でデータの行をフィルタできます。構成した条件に基づいて行を維持または削除します。
条件に基づいて行を維持または削除する手順は次のとおりです。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [フィルタ] を選択し、[行を維持] や [If value contains] などのオプションを選択します。
- 条件を指定します。
- [適用] をクリックします。
値はフィルタに応じて変化します。Wrangler は、filter-rows-on
ディレクティブをレシピに追加します。データ パイプラインを実行すると、列の値に変換が適用されます。
行を維持
条件に基づいて行を維持する場合、条件を満たさない行は削除されます。条件を満たす行のみがデータセットに残ります。たとえば、[value is] を選択し、条件 Customer
を入力すると、Wrangler は文字列 Customer
を含む行を維持し、他の値を含む行を削除します。
行を削除する
条件に基づいて行を削除する場合、条件を満たす行がデータセットから削除されます。たとえば、行を削除して [value is empty] を選択すると、Wrangler は空の値または null 値を持つ列から行を削除します。
サポートされているフィルタ条件
行は次の条件に基づいてフィルタできます。
条件 | 説明 |
---|---|
value is empty | 空の値を含む値を維持または削除します。 |
value is | 指定された値と完全に一致する値を維持または削除します。文字列データ型を含む列の場合は、大文字と小文字を区別しないように選択できます。デフォルトでは、条件に大文字と小文字を含みます。 |
value contains | 指定された値を含む値を維持または削除します。 |
value starts with | 指定された値で始まる値を維持または削除します。 |
value ends with | 指定された値で終わる値を維持または削除します。 |
matches regex | 正規表現に一致する値を維持または削除します。 |
custom condition | カスタム条件に一致する値を維持または削除します。 |
次のステップ
- Wrangler ディレクティブの詳細を確認する。