データのマスク

このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに機密データをマスクする方法について説明します。ブール値型とバイト型を除く、任意のデータ型の列でデータをマスクできます。

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
  3. [マスク] を選択し、[カスタム選択] などのオプションを選択します。オプションについては、以降のセクションで説明します。

変換は、Wrangler ワークスペースの [データ] タブに表示されるプレビュー データに適用されます。Wrangler は、レシピにマスク ディレクティブを追加します。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。

最後の 4 文字のみを表示する

[最後の 4 文字のみを表示] マスキング オプションを選択すると、mask-number ディレクティブが変換ステップとしてレシピに追加されます。

最後の 2 文字のみを表示する

[最後の 2 文字のみを表示] マスキング オプションを選択すると、mask-number ディレクティブが変換ステップとしてレシピに追加されます。

カスタム選択

[カスタム選択] マスク オプションを使用すると、セル内のマスクする文字の位置を選択して、列の各行の同様の位置にある文字をマスクできます。たとえば、10 文字の文字列を含むセルで文字列の最初の 8 文字を選択すると、列の各行の最初の 8 文字がマスクされます。

マスクする特定の文字を選択するには:

  1. Cloud Data Fusion の Wrangler ワークスペースに移動します
  2. [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
  3. [マスク> カスタム選択] を選択します。マスクできる列の値は、青色の背景で表示されます。
  4. 列の任意のセル内で、マスキングする文字を選択します。
  5. [適用] をクリックします。

値のその部分が、列内のすべてのフィールドでマスクされます。

カスタム選択では、mask-number ディレクティブがレシピに追加されます。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。

シャッフルによる

[シャッフル] マスキング オプションでは、列内の各フィールドにランダムなマスキング パターンが適用されます。Wrangler は、mask-shuffle ディレクティブを変換ステップとしてレシピに追加します。

次のステップ