分類、秘匿化、匿名化

Cloud データ損失防止(DLP)を使用してセンシティブ データを把握、管理、保護できます。Cloud DLP を使用すると、テキストベースのコンテンツや画像(Google Cloud Storage リポジトリに保存されているコンテンツを含む)の中にあるセンシティブ データを簡単に分類して削除できます。

テキスト分類

次のテキスト入力があるとします。

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

出力は見つかったもののリストであり、次のカテゴリに分類されます。

  • InfoType
  • Likelihood
  • OffsetInfoType である可能性のあるものが見つかった文字列中の位置)

出力例を下の表に示します。

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

テキストの自動秘匿化

自動秘匿化の機能では、機密データと認識されたもののリストを提供するのではなく、機密データと認識されたものが除去された出力が生成されます。

自動秘匿化における入力の例:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

プレースホルダ "***" を使用した出力例:

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

画像分類

Cloud DLP では、分類前のテキストの解読に OCR(Optical Character Recognition: 光学式文字認識)技術を使用します。テキスト分類と同様に見つかったテキストが返されますが、そのテキストが見つかった境界ボックスも追加されます。

ストレージ分類

ストレージ分類は、Cloud Storage、Datastore、BigQuery に保存されているデータをスキャンします。Cloud DLP にデータをストリーミングする代わりに、Cloud DLP でスキャンする Cloud Storage バケット、Datastore の種類、または BigQuery テーブルのストレージ ロケーションをリクエストで指定します。

Cloud Storage の場所にあるファイルをスキャンする場合、Cloud DLP はバイナリ、テキスト、画像、Microsoft Word、PDF、Apache Avro ファイルのスキャンをサポートします。Cloud DLP がスキャンできる Cloud Storage 内のファイルタイプのファイル拡張子のリストは、API リファレンスの FileType のページに記されています。認識されない形式のファイルは、バイナリ ファイルとしてスキャンされます。

スキャンの結果は、新しい BigQuery テーブルに保存することも、Pub/Sub トピックに公開することもできます。この結果に基づき、組み込みの BigQuery ツールを使用して高度な SQL 分析を行ったり、Google データポータルなどのツールを使用してレポートを生成したりできます。

Cloud DLP を使用して機密データのあるストレージ リポジトリをスキャンする方法については、ストレージとデータベースに含まれる機密データの検査をご覧ください。

他の Google Cloud ツールを使用したスキャン結果の可視化について詳しくは、Cloud DLP の調査結果の分析と報告をご覧ください。