分類、秘匿化、匿名化

機密データの保護を使用して機密データを把握、管理、保護できます。機密データの保護を使用すると、テキストベースのコンテンツや画像(Google Cloud Storage リポジトリに保存されているコンテンツを含む)の中にある機密データを簡単に分類して削除できます。

テキスト分類

次のテキスト入力があるとします。

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

出力は見つかったもののリストであり、次のカテゴリに分類されます。

  • InfoType
  • Likelihood
  • OffsetInfoType である可能性のあるものが見つかった文字列中の位置)

出力例を下の表に示します。

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

テキストの自動秘匿化

自動秘匿化の機能では、機密データと認識されたもののリストを提供するのではなく、機密データと認識されたものが除去された出力が生成されます。

自動秘匿化における入力の例:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

プレースホルダ "***" を使用した出力例:

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

画像分類

機密データの保護では、分類前のテキストの解読に OCR(Optical Character Recognition: 光学式文字認識)技術を使用します。テキスト分類と同様に見つかったテキストが返されますが、そのテキストが見つかった境界ボックスも追加されます。

ストレージ分類

ストレージ分類は、Cloud Storage、Datastore モードの Firestore(Datastore)、BigQuery に保存されているデータをスキャンします。機密データの保護にデータをストリーミングする代わりに、機密データの保護でスキャンする Cloud Storage バケット、Datastore の種類、または BigQuery テーブルのストレージ ロケーションをリクエストで指定します。

Cloud Storage の領域にあるファイルをスキャンする場合、機密データの保護では、バイナリ、テキスト、画像、Microsoft Word、Microsoft Excel、Microsoft PowerPoint、PDF、Apache Avro ファイルのスキャンがサポートされます。機密データの保護がスキャンできる Cloud Storage 内のファイルタイプのファイル拡張子のリストは、API リファレンスの FileType のページに記されています。認識されない形式のファイルは、バイナリ ファイルとしてスキャンされます。

スキャンの結果は、新しい BigQuery テーブルに保存することも、Pub/Sub トピックに公開することもできます。この結果に基づき、組み込みの BigQuery ツールを使用して高度な SQL 分析を行ったり、Looker Studio などのツールを使用してレポートを生成したりできます。

機密データの保護を使用してストレージ リポジトリの機密データをスキャンする方法については、ストレージとデータベースの機密データの検査をご覧ください。

他の Google Cloud ツールを使用したスキャン結果の可視化について詳しくは、機密データの保護の検出結果の分析と報告をご覧ください。

次のステップ