データのマスク

このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに機密データをマスクする方法について説明します。ブール値型とバイト型を除く、任意のデータ型の列でデータをマスクできます。

変換は、Wrangler ワークスペースの [データ] タブに表示されるプレビューデータに適用されます。Wrangler は、レシピにマスクディレクティブを追加します。データパイプラインを実行すると、列内のすべての値に変換が適用されます。

最後の 4 文字のみを表示する

[最後の 4 文字のみを表示] マスキングオプションを選択すると、mask-number ディレクティブが変換ステップとしてレシピに追加されます。

[最後の 2 文字のみを表示] マスキングオプションを選択すると、mask-number ディレクティブが変換ステップとしてレシピに追加されます。

[カスタム選択] マスクオプションを使用すると、セル内のマスクする文字の位置を選択して、列の各行の同様の位置にある文字をマスクできます。たとえば、10 文字の文字列を含むセルで文字列の最初の 8 文字を選択すると、列の各行の最初の 8 文字がマスクされます。

マスクする特定の文字を選択するには:

値のその部分が、列内のすべてのフィールドでマスクされます。

カスタム選択では、mask-number ディレクティブがレシピに追加されます。データパイプラインを実行すると、列内のすべての値に変換が適用されます。

[シャッフル] マスキングオプションでは、列内の各フィールドにランダムなマスキングパターンが適用されます。Wrangler は、mask-shuffle ディレクティブを変換ステップとしてレシピに追加します。