BigQuery での Cloud DLP の使用

このページには、BigQuery で Cloud Data Loss Prevention(DLP)を使用する方法について記載しているページへの参照が含まれています。

クイックスタート ガイド

クイックスタート: Cloud DLP 検査スキャンのスケジュール設定
Cloud Storage バケット、BigQuery テーブル、または Datastore の種類の定期的な検査のスケジュールを設定します。手順の詳細については、Cloud DLP 検査ジョブの作成とスケジュール設定をご覧ください。

入門ガイド

このセクションには、BigQuery で Cloud DLP を使用する方法を説明する、タスクベースのガイドのカテゴリ別リストを掲載しています。

検査

ストレージとデータベースに含まれる機密データの検査
Cloud Storage バケット、BigQuery テーブル、または Datastore の種類にある機密データを検索する 1 回限りのジョブを作成します。
Cloud DLP 検査ジョブの作成とスケジュール設定
Cloud Storage バケット、BigQuery テーブル、Datastore の種類に含まれる機密データを検索するジョブトリガーを作成してスケジュール設定します。ジョブトリガーは、Cloud DLP ジョブの定期的な作成を自動化します。

スキャン結果の操作

Data Catalog への Cloud DLP のスキャン結果の送信
BigQuery テーブルをスキャンし、その検出結果を Data Catalog に送信すると、Cloud DLP の検出結果に基づいてタグが自動的に作成されます。
Security Command Center への Cloud DLP スキャン結果の送信
Cloud Storage バケット、BigQuery テーブル、または Datastore の種類をスキャンしてから、検出結果を Security Command Center に送信します。
DLP の検出結果の分析と報告
BigQuery を使用して、Cloud DLP の検出結果を分析します。
BigQuery で Cloud DLP の検出結果をクエリする
Cloud DLP によって特定された結果を分析するために BigQuery で使用できるサンプルクエリについて確認します。

再識別リスクの分析

再識別と開示リスクの評価

BigQuery テーブルに保存されている構造化データを分析し、次の再識別リスク指標を計算します。

数値統計とカテゴリ統計の計算

個々の BigQuery 列の最小値、最大値、分位値を決定します。

データポータルを使用した再識別リスクの可視化

データセットの k-匿名性を測定し、Google データポータルで可視化します。

チュートリアル

Cloud DLP を使用した PII の匿名化と再識別

個人を特定できる情報(PII)などの機密データを匿名化する自動データ変換パイプラインを作成します。この記事は、次のトピックを含む 4 部構成のシリーズです。

Dataflow、BigQuery ML、Cloud Data Loss Prevention(DLP) を使用した安全な異常検出ソリューションの構築

通信ネットワーク向けの安全なネットワーク異常検出ソリューションを構築します。

センシティブ データの移行ソリューションのデプロイ

BigQuery で機密データを移行するために設計されたエンドツーエンドのデータトークン化ソリューションを実装します。

翻訳依頼への投稿

以下の対象は、Cloud DLP チームではなく、コミュニティ メンバーが所有し、管理しています。これらの項目についてご不明な点がおありの場合は、それぞれのオーナーにお問い合わせください。

Cloud Data Loss Prevention(DLP)を使用して BigQuery データを検査し、Data Catalog タグを作成する
Cloud Data Loss Prevention API を使用して BigQuery データを検査し、Data Catalog API を使用して、Cloud DLP が検出した機密要素に従って列レベルのタグを作成します。
Cloud DLP を使用したイベント ドリブン サーバーレス スケジューリング アーキテクチャ
Cloud Data Loss Prevention API を使用して BigQuery データを検査するイベント ドリブンのサーバーレス スケジューリング アプリケーションを設定します。
Google Cloud のストリーム分析と AI サービスを使用したリアルタイムの異常検出
ログファイル内の異常を検出するためのリアルタイム人工知能(AI)パターンを説明します。この概念実証ソリューションでは、Pub/Sub、Dataflow、BigQuery ML、Cloud DLP を使用します。
Dataflow と Cloud DLP を使用した BigQuery へのリレーショナル データベースのインポート
Dataflow と Cloud DLP を使用して、リレーショナル データベースから BigQuery にデータを安全にトークン化してインポートします。この例では、PII データを永続化する前にトークン化する方法を説明します。

料金

BigQuery テーブルを検査すると、ストレージ検査ジョブの料金に従って Cloud DLP の費用が発生します。

また、検査結果を BigQuery テーブルに保存すると、BigQuery の料金が適用されます。