このページでは、Cloud Data Fusion Studio の Wrangler ワークスペースでデータを準備するときに機密データをマスクする方法について説明します。ブール値型とバイト型を除く、任意のデータ型の列でデータをマスクできます。
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [マスク] を選択し、[カスタム選択] などのオプションを選択します。オプションについては、以降のセクションで説明します。
変換は、Wrangler ワークスペースの [データ] タブに表示されるプレビュー データに適用されます。Wrangler は、レシピにマスク ディレクティブを追加します。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。
最後の 4 文字のみを表示する
[最後の 4 文字のみを表示] マスキング オプションを選択すると、mask-number
ディレクティブが変換ステップとしてレシピに追加されます。
最後の 2 文字のみを表示する
[最後の 2 文字のみを表示] マスキング オプションを選択すると、mask-number
ディレクティブが変換ステップとしてレシピに追加されます。
カスタム選択
[カスタム選択] マスク オプションを使用すると、セル内のマスクする文字の位置を選択して、列の各行の同様の位置にある文字をマスクできます。たとえば、10 文字の文字列を含むセルで文字列の最初の 8 文字を選択すると、列の各行の最初の 8 文字がマスクされます。
マスクする特定の文字を選択するには:
- Cloud Data Fusion の Wrangler ワークスペースに移動します。
- [データ] タブで列名に移動し、arrow_drop_down 展開矢印をクリックします。
- [マスク> カスタム選択] を選択します。マスクできる列の値は、青色の背景で表示されます。
- 列の任意のセル内で、マスキングする文字を選択します。
- [適用] をクリックします。
値のその部分が、列内のすべてのフィールドでマスクされます。
カスタム選択では、mask-number
ディレクティブがレシピに追加されます。データ パイプラインを実行すると、列内のすべての値に変換が適用されます。
シャッフルによる
[シャッフル] マスキング オプションでは、列内の各フィールドにランダムなマスキング パターンが適用されます。Wrangler は、mask-shuffle
ディレクティブを変換ステップとしてレシピに追加します。
次のステップ
- Wrangler ディレクティブの詳細を確認する。