BigQuery での Cloud DLP の使用

コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

このページには、BigQuery で Cloud Data Loss Prevention を使用する方法について記載しているページへの参照が含まれています。

クイックスタート ガイド

クイックスタート: Cloud DLP 検査スキャンのスケジュール設定
Cloud Storage バケット、BigQuery テーブル、または Datastore の種類の定期的な検査のスケジュールを設定します。詳細な手順については、Cloud DLP 検査ジョブの作成とスケジュール設定をご覧ください。

入門ガイド

このセクションには、BigQuery で Cloud DLP を使用する方法を説明する、タスクベースのガイドのカテゴリ別リストを掲載しています。

検査

ストレージとデータベースに含まれる機密データの検査
Cloud Storage バケット、BigQuery テーブル、または Datastore の種類にある機密データを検索する 1 回限りのジョブを作成します。
Cloud DLP 検査ジョブの作成とスケジュール設定
Cloud Storage バケット、BigQuery テーブル、Datastore の種類に含まれる機密データを検索するジョブトリガーを作成してスケジュール設定します。ジョブトリガーは、Cloud DLP ジョブの定期的な作成を自動化します。

スキャン結果の操作

Data Catalog への Cloud DLP のスキャン結果の送信
BigQuery テーブルをスキャンし、その検出結果を Data Catalog に送信すると、Cloud DLP の検出結果に基づいてタグが自動的に作成されます。
Security Command Center への Cloud DLP スキャン結果の送信
Cloud Storage バケット、BigQuery テーブル、または Datastore の種類をスキャンしてから、検出結果を Security Command Center に送信します。
DLP の検出結果の分析と報告
BigQuery を使用して、Cloud DLP の検出結果の分析を実行します。
BigQuery で Cloud DLP の検出結果をクエリする
Cloud DLP によって特定された結果を分析するために BigQuery で使用できるサンプルクエリについて確認します。

再識別リスクの分析

再識別と開示リスクの評価

BigQuery テーブルに保存されている構造化データを分析し、次の再識別リスク指標を計算します。

数値統計とカテゴリ統計の計算

個々の BigQuery 列の最小値、最大値、分位値を決定します。

Looker Studio を使用した再識別リスクの可視化

データセットの k-匿名性を測定し、Looker Studio で可視化します。

チュートリアル

Cloud DLP を使用した大規模なデータセットにおける PII の匿名化と再識別
個人を特定できる情報(PII)などの機密データを匿名化する自動データ変換パイプラインを作成します。
センシティブ データの移行ソリューションのデプロイ
BigQuery で機密データを移行するために設計されたエンドツーエンドのデータトークン化ソリューションを実装します。

おすすめの方法

機密データを格納する BigQuery データ ウェアハウスを保護する
データの匿名化、機密データの差分処理、列レベルのアクセス制御など、Google Cloud でデータ ウェアハウスを作成、デプロイ、運用する際のデータ ガバナンスのための構造概要とベスト プラクティス。

翻訳依頼への投稿

以下の対象は、Cloud DLP チームではなく、コミュニティ メンバーが所有し、管理しています。これらの項目についてご不明な点がおありの場合は、それぞれのオーナーにお問い合わせください。

Cloud Data Loss Prevention を使用して BigQuery データを検査し、Data Catalog タグを作成する
Cloud Data Loss Prevention API を使用して BigQuery データを検査し、Data Catalog API を使用して、Cloud DLP が検出した機密要素に従って列レベルのタグを作成します。
Cloud DLP を使用したイベント ドリブン サーバーレス スケジューリング アーキテクチャ
Cloud Data Loss Prevention API を使用して BigQuery データを検査するイベント ドリブンのサーバーレス スケジューリング アプリケーションを設定します。
Google Cloud のストリーム分析と AI サービスを使用したリアルタイムの異常検出
ログファイル内の異常を検出するためのリアルタイム人工知能(AI)パターンを説明します。この概念実証では、Pub/Sub、Dataflow、BigQuery ML、Cloud DLP を使用します。
Dataflow と Cloud DLP を使用した BigQuery へのリレーショナル データベースのインポート
Dataflow と Cloud DLP を使用して、リレーショナル データベースから BigQuery にデータを安全にトークン化してインポートします。この例では、PII データを永続化する前にトークン化する方法を説明します。

料金

BigQuery テーブルを検査すると、ストレージ検査ジョブの料金に従って Cloud DLP の費用が発生します。

また、検査結果を BigQuery テーブルに保存すると、BigQuery の料金が適用されます。