このページには、BigQuery で機密データの保護を使用する方法について記載しているページへの参照が含まれています。
クイックスタート ガイド
- クイックスタート: 機密データの保護の検査スキャンのスケジュール設定
- Cloud Storage バケット、BigQuery テーブル、または Datastore の種類の定期的な検査のスケジュールを設定します。詳細な手順については、機密データの保護検査ジョブの作成とスケジュール設定をご覧ください。
入門ガイド
このセクションには、BigQuery で機密データの保護を使用する方法を説明する、タスクベースのガイドのカテゴリ別リストを掲載しています。
検査
- ストレージとデータベースに含まれる機密データの検査
- Cloud Storage バケット、BigQuery テーブル、または Datastore の種類にある機密データを検索する 1 回限りのジョブを作成します。
- 機密データの保護の検査ジョブとジョブトリガーの作成
- Cloud Storage バケット、BigQuery テーブル、Datastore の種類に含まれる機密データを検索するジョブトリガーを作成してスケジュール設定します。ジョブトリガーは、定期的に機密データの保護ジョブの作成を自動化します。
スキャン結果の操作
- Data Catalog への機密データの保護スキャン結果の送信
- BigQuery テーブルをスキャンして、検出結果を Data Catalog に送信し、機密データの保護の検出結果に基づいてタグを自動的に作成します。
- 機密データの保護のスキャン結果を Security Command Center に送信する
- Cloud Storage バケット、BigQuery テーブル、または Datastore の種類をスキャンしてから、検出結果を Security Command Center に送信します。
- 機密データの保護の検出結果の分析と報告
- BigQuery を使用して、機密データの保護の検出結果の分析を実行します。
- BigQuery で機密データの保護の検出結果をクエリする
- 機密データの保護によって特定された結果を分析するために BigQuery で使用できるサンプルクエリについて確認します。
再識別リスクの分析
- 再識別と開示リスクの評価
BigQuery テーブルに保存されている構造化データを分析して、次の再識別指標を計算します。
- 数値統計とカテゴリ統計の計算
個々の BigQuery 列の最小値、最大値、分位値を決定します。
- Looker Studio を使用した再識別リスクの可視化
データセットの k-匿名性を測定し、Looker Studio で可視化します。
チュートリアル
- クエリ時に BigQuery データを匿名化する
- BigQuery のリモート関数を使用してリアルタイムのクエリ結果でデータを匿名化、再識別する詳しい手順に従います。
- 機密データの保護を使用した大規模なデータセットにおける PII の匿名化と再識別
- 個人を特定できる情報(PII)などの機密データを匿名化する自動データ変換パイプラインを作成するためのリファレンス アーキテクチャを確認します。
おすすめの方法
- 機密データを格納する BigQuery データ ウェアハウスを保護する
- データの匿名化、機密データの差分処理、列レベルのアクセス制御など、Google Cloud でデータ ウェアハウスを作成、デプロイ、運用する際のデータ ガバナンスのための構造概要とベスト プラクティス。
翻訳依頼への投稿
以下の対象は、機密データの保護チームではなく、コミュニティ メンバーが所有し、管理しています。これらの項目についてご不明な点がおありの場合は、それぞれのオーナーにお問い合わせください。
- 機密データの保護で BigQuery データを検査し、Data Catalog タグを作成する
- Cloud Data Loss Prevention API を使用して BigQuery データを検査し、Data Catalog API を使用して、機密データの保護が検出した機密要素に従って列レベルのタグを作成します。
- 機密データの保護を使用したイベント ドリブン サーバーレス スケジューリング アーキテクチャ
- Cloud Data Loss Prevention API を使用して BigQuery データを検査する、イベント ドリブンなサーバーレス スケジューリング アプリケーションを設定します。
- Google Cloud のストリーム分析と AI サービスを使用したリアルタイムの異常検出
- ログファイル内の異常を検出するためのリアルタイム人工知能(AI)パターンについて説明します。この概念実証では、Pub/Sub、Dataflow、BigQuery ML、機密データの保護を使用します。
- Dataflow と機密データの保護を使用した BigQuery へのリレーショナル データベースのインポート
- Dataflow と機密データの保護を使用して、リレーショナル データベースから BigQuery にデータを安全にトークン化してインポートします。この例では、PII データが永続化される前にトークン化する方法を説明します。
料金
BigQuery テーブルを検査すると、ストレージ検査ジョブの料金に従って機密データの保護の費用が発生します。
さらに、検査結果を BigQuery テーブルに保存すると、BigQuery の料金が適用されます。