機密データの保護を使用して機密データを把握、管理、保護できます。機密データの保護を使用すると、テキストベースのコンテンツや画像(Google Cloud Storage リポジトリに保存されているコンテンツを含む)の中にある機密データを簡単に分類して削除できます。
テキスト分類
次のテキスト入力があるとします。
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
出力は見つかったもののリストであり、次のカテゴリに分類されます。
InfoType
Likelihood
Offset
(InfoType
である可能性のあるものが見つかった文字列中の位置)
出力例を下の表に示します。
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
テキストの自動秘匿化
自動秘匿化の機能では、機密データと認識されたもののリストを提供するのではなく、機密データと認識されたものが除去された出力が生成されます。
自動秘匿化における入力の例:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
プレースホルダ "***" を使用した出力例:
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
画像分類
機密データの保護では、分類前のテキストの解読に OCR(Optical Character Recognition: 光学式文字認識)技術を使用します。テキスト分類と同様に見つかったテキストが返されますが、そのテキストが見つかった境界ボックスも追加されます。
ストレージ分類
ストレージ分類は、Cloud Storage、Datastore モードの Firestore(Datastore)、BigQuery に保存されているデータをスキャンします。機密データの保護にデータをストリーミングする代わりに、機密データの保護でスキャンする Cloud Storage バケット、Datastore の種類、または BigQuery テーブルのストレージ ロケーションをリクエストで指定します。
Cloud Storage の領域にあるファイルをスキャンする場合、機密データの保護では、バイナリ、テキスト、画像、Microsoft Word、Microsoft Excel、Microsoft PowerPoint、PDF、Apache Avro ファイルのスキャンがサポートされます。機密データの保護がスキャンできる Cloud Storage 内のファイルタイプのファイル拡張子のリストは、API リファレンスの FileType
のページに記されています。認識されない形式のファイルは、バイナリ ファイルとしてスキャンされます。
スキャンの結果は、新しい BigQuery テーブルに保存することも、Pub/Sub トピックに公開することもできます。この結果に基づき、組み込みの BigQuery ツールを使用して高度な SQL 分析を行ったり、Looker Studio などのツールを使用してレポートを生成したりできます。
機密データの保護を使用してストレージ リポジトリの機密データをスキャンする方法については、ストレージとデータベースの機密データの検査をご覧ください。
他の Google Cloud ツールを使用したスキャン結果の可視化について詳しくは、機密データの保護の検出結果の分析と報告をご覧ください。
次のステップ
- 画像の検査と秘匿化の詳細を確認する。
- 機密データの保護で使用できる変換方法を学習する。
- 機密データの保護によるセンシティブ データの削除の Codelab に取り組む。
- データの匿名化されたコピーのストレージ内への作成について確認する。