このページでは、データ プロファイルからの検出結果を修正する方法について説明します。
高データリスク
データリスクが高い列またはテーブルには、追加の保護なしで機密情報の証拠があります。データリスク スコアを下げるには、次のことを行うことを検討してください。
機密データを含む BigQuery 列の場合は、BigQuery ポリシータグを適用して、特定のアクセス権が付与されているアカウントへのアクセスを制限します。
変更を行う前に、列レベルの制限があるテーブルをプロファイリングするために必要な権限がサービス エージェントに付与されていることを確認してください。そうしなければ、機密データの保護にエラーが表示されます。詳細については、データ プロファイラに関する問題のトラブルシューティングをご覧ください。
マスキングやトークン化などの匿名化手法を使用して、未加工の機密データを匿名化します。
高リスクのデータが必要ない場合は、機密性の高い列の削除を検討してください。
高いフリーテキスト スコア
フリーテキスト スコアが高い列(特に複数の infoType(PHONE_NUMBER
、US_SOCIAL_SECURITY_NUMBER
、DATE_OF_BIRTH
など)の証拠がある列)には、非構造化データと個人情報(PII)のインスタンスが含まれている場合があります。この列はメモまたはコメント フィールドにできます。自由形式のテキストには潜在的なリスクがあります。たとえば、このフィールドに「1985 年 1 月 1 日 生まれ」と入力する場合が該当します。
機密データの保護は、非構造化データを処理するように設計されています。この種のデータについて理解を深めるには、以下を検討してください。
BigQuery データの場合、BigQuery テーブルでオンデマンド検査を実行することで、PII が存在する場合がある行またはセルを特定できます。
次のステップ
機密データの保護でテーブルと列のデータのリスクと機密性レベルを計算する方法について学習する。
どのようにして Forrester が Google Cloud を非構造化データ セキュリティ プラットフォームのリーダーに選出したかを学習する。