Cloud Data Loss Prevention を使用してセンシティブ データを把握、管理、保護できます。Cloud DLP を使用すると、テキストベースのコンテンツや画像(Google Cloud Storage リポジトリに保存されているコンテンツを含む)の中にあるセンシティブ データを簡単に分類して削除できます。
テキスト分類
次のテキスト入力があるとします。
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
出力は見つかったもののリストであり、次のカテゴリに分類されます。
InfoType
Likelihood
Offset
(InfoType
である可能性のあるものが見つかった文字列中の位置)
出力例を下の表に示します。
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
テキストの自動秘匿化
自動秘匿化の機能では、機密データと認識されたもののリストを提供するのではなく、機密データと認識されたものが除去された出力が生成されます。
自動秘匿化における入力の例:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
プレースホルダ "***" を使用した出力例:
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
画像分類
Cloud DLP では、分類前のテキストの解読に OCR(Optical Character Recognition: 光学式文字認識)技術を使用します。テキスト分類と同様に見つかったテキストが返されますが、そのテキストが見つかった境界ボックスも追加されます。
ストレージ分類
ストレージ分類は、Cloud Storage、Datastore、BigQuery に保存されているデータをスキャンします。Cloud DLP にデータをストリーミングする代わりに、Cloud DLP でスキャンする Cloud Storage バケット、Datastore の種類、または BigQuery テーブルのストレージ ロケーションをリクエストで指定します。
Cloud Storage の領域にあるファイルをスキャンする場合、Cloud DLP では、バイナリ、テキスト、画像、Microsoft Word、Microsoft Excel、Microsoft PowerPoint、PDF、Apache Avro ファイルのスキャンがサポートされます。Cloud DLP がスキャンできる Cloud Storage 内のファイルタイプのファイル拡張子のリストは、API リファレンスの FileType
のページに記されています。認識されない形式のファイルは、バイナリ ファイルとしてスキャンされます。
スキャンの結果は、新しい BigQuery テーブルに保存することも、Pub/Sub トピックに公開することもできます。この結果に基づき、組み込みの BigQuery ツールを使用して高度な SQL 分析を行ったり、Looker Studio などのツールを使用してレポートを生成したりできます。
Cloud DLP を使用して機密データのあるストレージ リポジトリをスキャンする方法については、ストレージとデータベースに含まれる機密データの検査をご覧ください。
他の Google Cloud ツールを使用したスキャン結果の可視化について詳しくは、Cloud DLP の調査結果の分析と報告をご覧ください。
次のステップ
- 画像の検査と秘匿化の詳細を確認する。
- Cloud Data Loss Prevention で機密データを秘匿化する Codelab に取り組む。
- 匿名化されたデータのコピーをストレージ内に作成する方法を学習する。