Cloud Data Loss Prevention（Cloud DLP）は機密データの保護の一部になりました。API 名は Cloud Data Loss Prevention API（DLP API）のままです。機密データの保護を構成するサービスについては、機密データの保護の概要をご覧ください。

このページは Cloud Translation API によって翻訳されました。

データプロファイル

このページでは、機密データの検出サービスについて説明します。このサービスにより、機密データとリスクの高いデータが組織内のどこに保管されているかを特定できます。

概要

検出サービスを使用すると、機密データとリスクの高いデータが存在する場所を識別して、組織全体のデータを保護できます。検出スキャン構成を作成すると、Sensitive Data Protection によってリソースがスキャンされ、プロファイリングの対象範囲内のデータが特定されます。次に、データのプロファイルを生成します。検出構成がアクティブである限り、Sensitive Data Protection は、追加および変更するデータを自動的にプロファイリングします。組織全体、個々のフォルダ、個別のプロジェクトでデータプロファイルを生成できます。

各データプロファイルは、サポートされているリソースをスキャンして検出サービスが収集する分析情報とメタデータのセットです。分析情報には、予測された infoType と、データの計算されたデータリスクと機密性レベルが含まれます。これらの分析情報を使用し、データの保護、共有、使用について、情報に基づく意思決定を行います。

データプロファイルは、さまざまな詳細レベルで生成されます。たとえば、BigQuery データのプロファイリングを行うと、プロジェクト、テーブル、列のレベルでプロファイルが生成されます。

次の図は、列レベルのデータプロファイルのリストを示しています。画像をクリックすると拡大します。

各データプロファイルに含まれる分析情報とメタデータのリストについては、指標のリファレンスをご覧ください。

Google Cloud リソース階層の詳細については、リソース階層をご覧ください。

データプロファイルの生成

データプロファイルの生成を開始するには、検出スキャン構成（データプロファイル構成とも呼ばれます）を作成します。このスキャン構成では、検出オペレーションのスコープと、プロファイリングするデータの種類を設定します。スキャン構成では、フィルタを設定して、プロファイリングするデータまたはスキップするデータのサブセットを指定できます。プロファイリングスケジュールを設定することもできます。

また、スキャン構成を作成する際には、使用する検査テンプレートも設定します。検査テンプレートには、Sensitive Data Protection でスキャンする必要がある機密データの種類（infoType とも呼ばれます）を指定します。

Sensitive Data Protection は、データプロファイルを作成する際、スキャンの構成と検査テンプレートに基づいてデータを分析します。

Sensitive Data Protection は、データプロファイル生成の頻度で説明されているようにデータを再プロファイリングします。スケジュールの作成によって、スキャン構成でプロファイリング頻度をカスタマイズできます。検出サービスでデータを再プロファイリングするには、再プロファイルオペレーションを強制するをご覧ください。

検出タイプ

このセクションでは、実行できる検出オペレーションのタイプと、サポートされているデータリソースについて説明します。

BigQuery と BigLake の検出

BigQuery データのプロファイリングを行うと、プロジェクト、テーブル、列のレベルでデータプロファイルが生成されます。BigQuery テーブルをプロファイリングした後、詳しい検査を実行して、結果をさらに調査できます。

機密データの保護は、BigQuery Storage Read API によってサポートされている次のようなテーブルをプロファイリングします。

標準の BigQuery テーブル
Table Snapshots
Cloud Storage に保存されている BigLake テーブル

以下はサポートされていません。

BigQuery Omni テーブル。
個々の行のシリアル化されたデータサイズが、BigQuery Storage Read API でサポートされているシリアル化されたデータの最大サイズ（128 MB）を超えているテーブル。
Google スプレッドシートなどの BigLake 以外の外部テーブル。

BigQuery データのプロファイリング方法については、以下をご覧ください。

BigQuery の詳細については、BigQuery のドキュメントをご覧ください。

Cloud SQL の検出

Cloud SQL データをプロファイリングすると、プロジェクト、テーブル、列の各レベルでデータプロファイルが生成されます。検出を開始する前に、プロファイリングする各 Cloud SQL インスタンスの接続の詳細を指定する必要があります。

Cloud SQL データのプロファイリング方法については、以下をご覧ください。

Cloud SQL の詳細については、Cloud SQL のドキュメントをご覧ください。

Cloud Storage の検出

Cloud Storage データのプロファイリングを行うと、バケットレベルでデータプロファイルが生成されます。機密データの保護は、検出されたファイルをファイルクラスタにグループ化し、各クラスタの概要を提供します。

Cloud Storage データのプロファイリング方法については、以下をご覧ください。

Cloud Storage の詳細については、Cloud Storage のドキュメントをご覧ください。

Vertex AI の Discovery

Vertex AI データセットのプロファイリングを行うと、トレーニングデータの保存場所（Cloud Storage または BigQuery）に応じて、機密データの保護によってファイルストアデータプロファイルまたはテーブルデータプロファイルが生成されます。

詳しくは以下をご覧ください。

Vertex AI の詳細については、Vertex AI のドキュメントをご覧ください。

他のクラウドプロバイダの検出

S3 データのプロファイリングを行うと、バケットレベルでデータプロファイルが生成されます。Azure Blob Storage データのプロファイリングを行うと、コンテナレベルでデータプロファイルが生成されます。

どちらの場合も、機密データの保護は検出されたファイルをファイルクラスタにグループ化し、各クラスタの概要を提供します。

詳しくは以下をご覧ください。

Cloud Run の環境変数

検出サービスは、Cloud Run functions と Cloud Run サービスリビジョンの環境変数でシークレットの存在を検出し、検出結果を Security Command Center に送信できます。データプロファイルは生成されません。

詳細については、環境変数のシークレットを Security Command Center に報告するをご覧ください。

データプロファイルの構成と表示に必要なロール

以下のセクションでは、必要なユーザーロールを目的別に分類して説明します。組織の設定方法に応じて、異なるユーザーに異なるタスクを実行させることができます。たとえば、データプロファイルを構成しているユーザーと、定期的にモニタリングしているユーザーは異なる場合があります。

組織レベルまたはフォルダレベルでデータプロファイルを操作するために必要なロール

これらのロールを使用すると、組織レベルまたはフォルダレベルでデータプロファイルを構成および表示できます。

これらのロールが組織レベルの適切なユーザーに付与されていることを確認してください。または、 Google Cloud 管理者は、関連する権限のみを持つカスタムロールを作成できます。

目的	事前定義ロール	関連する権限
検出スキャン構成を作成してデータプロファイルを表示する	DLP 管理者（`roles/dlp.admin`）	dlp.columnDataProfiles.list dlp.fileStoreProfiles.list dlp.inspectTemplates.create dlp.jobs.create dlp.jobs.list dlp.jobTriggers.create dlp.jobTriggers.list dlp.projectDataProfiles.list dlp.tableDataProfiles.list
サービスエージェントコンテナとして使用されるプロジェクトを作成する¹	プロジェクト作成者（`roles/resourcemanager.projectCreator`）	resourcemanager.organizations.get resourcemanager.projects.create
検出アクセス権を付与する²	次のいずれかになります。組織管理者（`roles/resourcemanager.organizationAdmin`）セキュリティ管理者（`roles/iam.securityAdmin`）	resourcemanager.organizations.getIamPolicy resourcemanager.organizations.setIamPolicy
データプロファイルの表示（読み取り専用）	DLP データプロファイル読み取り（`roles/dlp.dataProfilesReader`）	dlp.columnDataProfiles.list dlp.fileStoreProfiles.list dlp.projectDataProfiles.list dlp.tableDataProfiles.list
データプロファイルの表示（読み取り専用）	DLP 読み取り（`roles/dlp.reader`）	dlp.jobs.list dlp.jobTriggers.list

¹ プロジェクト作成者（roles/resourcemanager.projectCreator）のロールが付与されていなくても、スキャン構成を作成できますが、使用するサービスエージェントコンテナは既存のプロジェクトにする必要があります。

² 組織管理者（roles/resourcemanager.organizationAdmin）またはセキュリティ管理者（roles/iam.securityAdmin）のロールを付与されていなくても、スキャン構成を作成できます。スキャン構成を作成した後、これらのロールのいずれかを持つ組織内のユーザーがサービスエージェントに検出アクセス権を付与する必要があります。

プロジェクトレベルでデータプロファイルを操作するために必要なロール

これらのロールを使用すると、プロジェクトレベルでデータプロファイルを構成、表示できます。

これらのロールがプロジェクトレベルの適切なユーザーに付与されていることを確認してください。または、 Google Cloud 管理者は、関連する権限のみを持つカスタムロールを作成できます。

目的	事前定義ロール	関連する権限
データプロファイルの構成と表示	DLP 管理者（`roles/dlp.admin`）	dlp.columnDataProfiles.list dlp.fileStoreProfiles.list dlp.inspectTemplates.create dlp.jobs.create dlp.jobs.list dlp.jobTriggers.create dlp.jobTriggers.list dlp.projectDataProfiles.list dlp.tableDataProfiles.list
データプロファイルの表示（読み取り専用）	DLP データプロファイル読み取り（`roles/dlp.dataProfilesReader`）	dlp.columnDataProfiles.list dlp.fileStoreProfiles.list dlp.projectDataProfiles.list dlp.tableDataProfiles.list
データプロファイルの表示（読み取り専用）	DLP 読み取り（`roles/dlp.reader`）	dlp.jobs.list dlp.jobTriggers.list

検出スキャンの構成

検出スキャン構成（検出構成またはスキャン構成とも呼ばれます）では、Sensitive Data Protection がデータをプロファイリングする方法を指定します。次の設定が含まれます。

検出オペレーションのスコープ（組織、フォルダ、プロジェクト）
プロファイリングするリソースのタイプ
使用する検査テンプレート
スキャン頻度
検出に含めるか除外するデータの特定のサブセット
検出後に機密データの保護で行うアクション（プロファイルの公開先となる Google Cloud サービスなど）
検出オペレーションに使用するサービスエージェント

検出スキャン構成の作成方法については、次のページをご覧ください。

BigQuery データの検出
- 単一プロジェクトの BigQuery データのプロファイリング
- 組織またはフォルダの BigQuery データのプロファイリング
Cloud SQL データの検出
- 単一プロジェクトの Cloud SQL データをプロファイリングする
- 組織またはフォルダで Cloud SQL データをプロファイリングする
Cloud Storage データの検出
- 単一プロジェクト内の Cloud Storage データをプロファイリングする
- 組織またはフォルダ内の Cloud Storage データをプロファイリングする
Vertex AI データの検出
- 単一プロジェクトの Vertex AI データをプロファイリングする
- 組織またはフォルダの Vertex AI データをプロファイリングする
Amazon S3 データの検出
Azure Blob Storage データの検出
Cloud Run 環境変数のシークレットを Security Command Center に報告する（プロファイルは生成されません）

スキャン構成のスコープ

スキャン構成は次のレベルで作成できます。

組織
フォルダ
プロジェクト
単一のデータリソース

組織レベルとフォルダレベルで、2 つ以上のアクティブなスキャン構成で同じプロジェクトがスコープにある場合、そのプロジェクトのプロファイルを生成できるスキャン構成は機密データの保護によって決定されます。詳細については、このページのスキャン構成のオーバーライドをご覧ください。

プロジェクトレベルのスキャン構成では、常にターゲットプロジェクトをプロファイリングでき、親フォルダや組織のレベルで他の構成と競合することはありません。

単一リソースのスキャン構成は、単一のデータリソースでプロファイリングを探索してテストすることを目的としています。

スキャン構成の場所

スキャン構成を初めて作成するときに、機密データの保護がそれを保存する場所を指定します。それ以降に作成するスキャン構成は、すべて、同じリージョンに保存されます。

たとえば、フォルダ A のスキャン構成を作成して us-west1 リージョンに保存すると、後で他のリソースに対して作成するスキャン構成もそのリージョンに保存されます。

プロファイリングするデータに関するメタデータは、スキャン構成と同じリージョンにコピーされますが、データ自体は移動またはコピーされません。詳細については、データ所在地に関する検討事項をご覧ください。

検査テンプレート

検査テンプレートは、データをスキャンする際に機密データの保護が探す情報の種類（または infoType）を指定します。テンプレートでは、組み込み infoType とオプションのカスタム infoType を組み合わせて使用します。

また、確度レベルを指定して、機密データの保護が一致とみなす対象を絞り込むこともできます。ルールセットを追加して、望ましくない結果を除外すること、別の検出結果を含めることが可能です。

デフォルトでは、スキャンの構成で使用されている検査テンプレートに変更を加えると、その変更は将来のスキャンにのみ適用されます。このアクションで、データの再プロファイルオペレーションが実行されることはありません。

検査テンプレートの変更によって影響を受けるデータに対して再プロファイリングオペレーションをトリガーする場合は、スキャン構成でスケジュールを追加または更新し、検査テンプレートが変更されたときにデータを再プロファイリングするオプションをオンにします。詳細については、データプロファイル生成の頻度をご覧ください。

注: Google は検出アルゴリズムを定期的に改善しています。Google が実装する新しい改善で、お客様の組織やプロジェクトにメリットがあることが判明した場合は、データプロファイルが自動的に再生成され、スキャン構成のアクションがやり直される場合があります。このオペレーションに関して、Sensitive Data Protection で料金が発生することはありません。ただし、Google はアクションをやり直すため、他の Google Cloud サービスの使用に対して料金が発生する場合があります。たとえば、データプロファイルを BigQuery に保存するように Sensitive Data Protection を構成した場合、BigQuery の料金が発生する場合があります。

プロファイリングするデータがある各リージョンに検査テンプレートが必要です。複数のリージョンで 1 つのテンプレートを使用する場合は、global リージョンに保存されているテンプレートを使用します。組織のポリシーで global リージョンでの検査テンプレートの作成が妨げられている場合、リージョンごとに専用の検査テンプレートを設定する必要があります。詳細については、データ所在地に関する検討事項をご覧ください。

検査テンプレートは、機密データの保護プラットフォームの中核的なコンポーネントです。データプロファイルは、すべての機密データの保護サービスで使用できるものと同じ検査テンプレートを使用します。検査テンプレートの詳細については、テンプレートをご覧ください。

サービスエージェントコンテナとサービスエージェント

組織またはフォルダのスキャン構成を作成する際は、機密データの保護ではサービスエージェントコンテナを指定する必要があります。サービスエージェントコンテナは、組織レベルとフォルダレベルのプロファイリングオペレーションに関連する請求を追跡するために機密データの保護が使用する Google Cloud プロジェクトです。

サービスエージェントコンテナには、機密データの保護がユーザーの代わりにデータをプロファイリングするために使用するサービスエージェントが含まれています。サービスエージェントは、機密データの保護や他の API で認証を行うために必要とされます。サービスエージェントには、データへのアクセスとプロファイリングに必要なすべての権限が不可欠です。サービスエージェントの ID は次の形式です。

service-PROJECT_NUMBER@dlp-api.iam.gserviceaccount.com

ここでは、PROJECT_NUMBER はサービスエージェントコンテナの数値識別子です。

サービスエージェントコンテナを設定するときに、既存のプロジェクトを選択できます。選択したプロジェクトにサービスエージェントが含まれている場合、機密データの保護はそのサービスエージェントに対して必要な IAM 権限を付与します。プロジェクトにサービスエージェントがない場合、機密データの保護は 1 つ作成し、それにデータプロファイリングの権限を自動的に付与します。

または、機密データの保護にサービスエージェントコンテナとサービスエージェントを自動的に作成させることもできます。機密データの保護によって、データプロファイリングの権限がサービスエージェントに自動的に付与されます。

両方の場合で、機密データの保護がサービスエージェントへのデータプロファイリングのアクセス権の付与に失敗すると、スキャン構成の詳細を表示する際に、エラーが表示されます。

プロジェクトレベルのスキャン構成の場合は、サービスエージェントコンテナは必要ありません。プロファイリングするプロジェクトが、サービスエージェントコンテナの目的を達成します。プロファイリングオペレーションを実行するには、機密データの保護はそのプロジェクト固有のサービスエージェントを使用します。

組織レベルまたはフォルダレベルでのデータプロファイリングへのアクセス

組織レベルまたはフォルダレベルで、プロファイリングを構成すると、機密データの保護はデータプロファイリング・アクセスをサービスエージェントに自動的に付与しようとします。ただし、IAM ロールを付与する権限がない場合、機密データの保護はユーザーの代わりにこのアクションを行うことはできません。 Google Cloud 管理者など、組織でこれらの権限を持つユーザーは、サービスエージェントにデータプロファイリングへのアクセス権を付与する必要があります。

データプロファイル生成の頻度

特定のリソースの検出スキャン構成を作成した後、Sensitive Data Protection によって最初のスキャンが実施され、スキャン構成の範囲内でデータがプロファイリングされます。

初期スキャンの後、Sensitive Data Protection はプロファイリングされたリソースを継続的にモニタリングします。リソースに追加されたデータは、追加された直後に自動的にプロファイリングされます。

デフォルトの再プロファイリング頻度

デフォルトの再プロファイリングの頻度は、スキャン構成の検出タイプによって異なります。

BigQuery プロファイリング: 各テーブルについて、30 日間待機してから、スキーマ、テーブル行、検査テンプレートに変更がある場合は、テーブルを再プロファイリングします。
Cloud SQL プロファイリング: 各テーブルについて、30 日間待機してから、スキーマまたは検査テンプレートに変更がある場合はテーブルを再プロファイリングします。
Vertex AI プロファイリング: 各データセットについて、30 日間待機してから、検査テンプレートに変更があった場合にデータセットを再プロファイリングします。
ファイルストアのプロファイリング: Google Cloud または他のクラウドの各ファイルストアについて、30 日間待機してから、検査テンプレートに変更がある場合はファイルストアを再プロファイリングします。

Sensitive Data Protection では、ファイルストレージバケットまたはコンテナを指す用語として「ファイルストア」を使用します。

再プロファイリングの頻度をカスタマイズする

スキャン構成では、データの異なるサブセットに 1 つ以上のスケジュールを作成して、再プロファイリングの頻度をカスタマイズできます。

次の再プロファイリングの頻度を使用できます。

再プロファイリングしない: 最初のプロファイルが生成された後、再プロファイリングしません。
毎日再プロファイリングする: 24 時間待ってから再プロファイリングします。
毎週再プロファイリングする: 7 日間待ってから再プロファイリングします。
毎月再プロファイリングする: 30 日間待ってから再プロファイリングします。

スケジュールに従って再プロファイリングする

スキャン構成では、データのサブセットが変更されたかどうかにかかわらず、定期的に再プロファイリングするかどうかを指定できます。設定した頻度は、プロファイリングオペレーション間の経過時間を指定します。たとえば、頻度を週単位に設定した場合、Sensitive Data Protection は、最後にプロファイリングされた 7 日後にデータリソースをプロファイリングします。

アップデート時の再プロファイリング

スキャン構成で、再プロファイリング操作をトリガーできるイベントを指定できます。このようなイベントの例としては、検査テンプレートの更新などがあります。

これらのイベントを選択すると、設定したスケジュールで、Sensitive Data Protection がデータを再プロファイリングする前に更新が蓄積されるのを待機する最長時間が指定されます。指定した期間内にスキーマの変更や検査テンプレートの変更など、適用可能な変更が発生しなかった場合、データは再プロファイリングされません。次に該当する変更が発生すると、影響を受けるデータは次回の機会で再プロファイリングされます。これは、さまざまな要因（使用可能なマシン容量や購入したサブスクリプションユニットなど）によって決まります。その後、Sensitive Data Protection は、設定されたスケジュールに従って更新が再び蓄積されるのを待機し始めます。

たとえば、スキャン構成がスキーマ変更時に毎月再プロファイリングするように設定されているとします。データプロファイルは 0 日目に最初に作成されました。30 日目までにスキーマの変更が行われないため、データの再プロファイリングは行われません。35 日目に、最初のスキーマ変更が行われます。Sensitive Data Protection は、更新されたデータを次の機会に再プロファイリングします。その後、システムはスキーマの更新が蓄積されるまでさらに 30 日間待機し、更新されたデータを再プロファイリングします。

再プロファイリングの開始から、オペレーションが完了するまでに最大 24 時間かかる場合があります。遅延が 24 時間を超え、サブスクリプション料金モードの場合は、その月の残りの容量があるかどうかを確認します。

シナリオの例については、データプロファイリングの料金の例をご覧ください。

検出サービスでデータを再プロファイリングするには、再プロファイルオペレーションを強制するをご覧ください。

パフォーマンスのプロファイリング

データのプロファイルにかかる時間は、以下を含む、いくつかの要因によって異なります。

プロファイリングされるデータリソースの数
データリソースのサイズ
テーブルの場合、列数
テーブルの場合、列のデータ型

したがって、過去の検査またはプロファイリングのタスクにおける機密データの保護のパフォーマンスは、将来のプロファイリングタスクでのパフォーマンスを示すものではありません。

データプロファイルの保持

機密データの保護は、データプロファイルの最新バージョンを 13 か月間保持します。Sensitive Data Protection がデータリソースを再プロファイリングすると、システムはそのデータリソースの既存のプロファイルを新しいプロファイルに置き換えます。

次のシナリオ例では、BigQuery のデフォルトのプロファイリング頻度が有効になっていることを前提としています。

1 月 1 日に、機密データの保護がテーブル A のプロファイリングをします。テーブル A は 1 年以上変更されないため、再プロファイリングされません。この場合、機密データの保護は、テーブル A のデータプロファイルを 13 か月間保持してから削除します。
1 月 1 日に、機密データの保護がテーブル A のプロファイリングをします。その月内に、組織内の誰かがそのテーブルのスキーマを更新します。この変更により、翌月、機密データの保護はテーブル A を自動的に再プロファイリングします。新しく生成されたデータプロファイルは、1 月に作成されたデータプロファイルを上書きします。

機密データの保護がデータプロファイリングに対して課金する方法については、検出料金をご覧ください。

データプロファイルを無期限に保持する場合、または行われた変更の記録を保持する場合は、プロファイリングを構成するときに、データプロファイルを BigQuery に保存することを検討してください。プロファイルを保存する BigQuery データセットを選択し、そのデータセットのテーブル有効期限ポリシーを管理します。

スキャン構成のオーバーライド

スキャン構成は、スコープと検出タイプの組み合わせごとに 1 つだけ作成できます。たとえば、BigQuery データプロファイリング用の組織レベルのスキャン構成と、シークレット検出用の組織レベルのスキャン構成は 1 つだけ作成できます。同様に、BigQuery データプロファイリング用のプロジェクトレベルのスキャン構成と、シークレット検出用のプロジェクトレベルのスキャン構成は 1 つだけ作成できます。

スコープ内に同じプロジェクトと検出タイプがあるスキャン構成が 2 つ以上有効になっている場合、次のルールが適用されます。

組織レベルとフォルダレベルのスキャン構成のうち、プロジェクトに最も近いものがプロジェクトの検出を実行できます。このルールは、同じ検出タイプのプロジェクトレベルのスキャン構成が存在する場合でも適用されます。
機密データの保護は、プロジェクトレベルのスキャン構成を組織レベルおよびフォルダレベルの構成とは独立して扱います。プロジェクトレベルで作成したスキャン構成は、親フォルダや親組織用に作成したスキャン構成をオーバーライドすることはできません。

アクティブなスキャン構成が 3 つある次の例について考えてみます。これらのスキャン構成はすべて BigQuery データプロファイリング用であるとします。

ここで、スキャン構成 1 は組織全体に適用され、スキャン構成 2 は チーム B フォルダに適用され、スキャン構成 3 は本番環境プロジェクトに適用されます。この例では、次のようになります。

機密データの保護は、スキャン構成 1 に従って、チーム B フォルダ下にないプロジェクトのすべてのテーブルをプロファイリングします。
機密データの保護は、チーム B フォルダのプロジェクト内のすべてのテーブル（本番環境内のテーブルを含む）をスキャン構成 2 に従ってプロファイリングします。
機密データの保護は、スキャン構成 3 に従って プロダクション プロジェクトのすべてのテーブルをプロファイリングします。

この例では、機密データの保護によって本番環境プロジェクト用の 2 つのプロファイルのセットが次の各スキャン構成用に 1 セットずつ生成されます。

スキャン構成 2
スキャン構成 3

ただし、同じプロジェクトに対して 2 つのプロファイルセットがあっても、ダッシュボードにはそのすべてが一緒に表示されることはありません。表示しているリソース（組織、フォルダ、プロジェクト）とリージョンで生成されたプロファイルのみが表示されます。

Google Cloudのリソース階層の詳細については、リソース階層をご覧ください。

データプロファイルのスナップショット

各データプロファイルには、スキャン構成のスナップショットと、その生成に使用された検査テンプレートが含まれています。このスナップショットを使用して、特定のデータプロファイルの生成に使用した設定を確認できます。

データ所在地に関する検討事項

データ所在地に関する考慮事項は、Google Cloud データまたは他のクラウドプロバイダのデータをスキャンするかどうかによって異なります。

Google Cloud データに関するデータ所在地に関する考慮事項

このセクションは、 Google Cloudリソースの機密データ検出にのみ適用されます。他のクラウドプロバイダのリソースに関連するデータ所在地に関する検討事項については、このページの他のクラウドプロバイダのデータに関するデータ所在地に関する検討事項をご覧ください。

機密データの保護は、データ所在地をサポートするように設計されています。データ所在地の要件に従う必要がある場合は、次の点を検討してください。

リージョン検査テンプレート

機密データの保護は、データが保存されているリージョンと同じリージョンでデータを処理します。つまり、データが現在のリージョンから離れることはありません。

また、検査テンプレートは、そのテンプレートと同じリージョンにあるデータをプロファイリングするためにのみ使用できます。たとえば、us-west1 リージョンに保存されている検査テンプレートを使用するように検出を構成すると、機密データの保護はそのリージョン内のデータのみをプロファイリングできます。

データがあるリージョンごとに専用の検査テンプレートを設定できます。global リージョンに保存されている検査テンプレートを指定した場合、機密データの保護は、そのテンプレートを専用の検査テンプレートのないリージョンのデータに使用します。

次の表にシナリオの例を示します。

シナリオ	サポート
`us` リージョンの検査テンプレートを使用して、`us` リージョンのデータをスキャンします。	サポート対象
`us` リージョンの検査テンプレートを使用して、`global` リージョンのデータをスキャンします。	非対応
`global` リージョンの検査テンプレートを使用して、`us` リージョンのデータをスキャンします。	サポート対象
`us-east1` リージョンの検査テンプレートを使用して、`us` リージョンのデータをスキャンします。	非対応
`us` リージョンの検査テンプレートを使用して、`us-east1` リージョンのデータをスキャンします。	非対応
`asia` リージョンの検査テンプレートを使用して、`us` リージョンのデータをスキャンします。	非対応

データプロファイルの構成

Sensitive Data Protection は、データプロファイルを作成する際、スキャン構成と検査テンプレートのスナップショットを作成し、各テーブルデータプロファイルまたは Filestore データプロファイルに保存します。global リージョンの検査テンプレートを使用するように検出を構成すると、機密データの保護はプロファイリングするデータを含む任意のリージョンにテンプレートをコピーします。同様に、スキャン構成もこれらのリージョンにコピーされます。

次の例について考えます。プロジェクト A にテーブル 1 が含まれています。テーブル 1 は us-west1 リージョンにあります。スキャン構成は us-west2 リージョンにあり、検査テンプレートは global リージョンにあります。

機密データの保護は、プロジェクト A をスキャンする際、テーブル 1 のデータプロファイルを作成し、us-west1 リージョンに保存します。テーブル 1 のテーブルデータプロファイルには、プロファイリングオペレーションで使用されるスキャン構成と検査テンプレートのコピーが含まれています。

検査テンプレートが他のリージョンにコピーされないようにするには、そうした他のリージョン内のデータをスキャンするように機密データの保護を構成しないでください。

データプロファイルのリージョンストレージ

機密データの保護は、データが存在するリージョンまたはマルチリージョンでデータを処理し、生成されたデータプロファイルを同じリージョンまたはマルチリージョンに保存します。

Google Cloud コンソールでデータプロファイルを表示するには、まずデータプロファイルが存在するリージョンを選択する必要があります。複数のリージョンにデータがある場合は、リージョンを切り替えて、各プロファイルセットを表示する必要があります。

サポートされていないリージョン

Sensitive Data Protection でサポートされていないリージョンにデータがある場合、検出サービスはそれらのデータリソースをスキップし、データプロファイルを表示するときにエラーを表示します。

マルチリージョン

Sensitive Data Protection では、マルチリージョンはリージョンの集合ではなく、1 つのリージョンとして扱われます。たとえば、us マルチリージョンと us-west1 リージョンは、データ所在地に関する限り 2 つの別々のリージョンとして扱われます。

ゾーンリソース

Sensitive Data Protection はリージョンサービスとマルチリージョンサービスであり、ゾーンを区別しません。Cloud SQL インスタンスなどのサポートされているゾーンリソースの場合、データは現在のリージョンで処理されますが、必ずしも現在のゾーンで処理されるとは限りません。たとえば、Cloud SQL インスタンスが us-central1-a ゾーンに保存されている場合、Sensitive Data Protection は us-central1 リージョンでデータプロファイルを処理して保存します。

Google Cloud ロケーションに関する一般的な情報については、地域とリージョンをご覧ください。

他のクラウドプロバイダのデータに関するデータ所在地に関する考慮事項

他のクラウドプロバイダのデータのプロファイリングを計画する場合は、次の点を考慮してください。

データプロファイルは、検出スキャン構成とともに保存されます。一方、 Google Cloud データをプロファイリングすると、プロファイルはプロファイリングするデータと同じリージョンに保存されます。
検査テンプレートを global リージョンに保存すると、そのテンプレートのインメモリコピーが、検出スキャン構成を保存するリージョンで読み取られます。
データは変更されません。データのインメモリコピーは、検出スキャン構成を保存するリージョンで読み取られます。ただし、機密データの保護は、データがパブリックインターネットに到達した後の通過場所については保証しません。データは SSL で暗号化されます。

コンプライアンス

機密データの保護がデータを処理し、コンプライアンス要件を満たすのに役立てる方法については、データセキュリティをご覧ください。

次のステップ

ID とセキュリティに関するブログ記事の機密データの保護を使用した BigQuery の自動データリスク管理を読む。
データプロファイリング費用を見積もる方法を確認する。
組織、フォルダ、プロジェクトレベルでデータをプロファイリングする方法を学びます。
機密データの保護でデータのプロファイリング時にデータのリスクと機密性レベルを計算する方法について学習する。
検出結果を修正する方法を学習する。
データプロファイラに関する問題のトラブルシューティングを行う方法を学習する。