単一プロジェクトのデータ プロファイリング費用を見積もる

このページでは、プロジェクト内の BigQuery データのプロファイリング費用を見積もる方法について説明します。組織またはフォルダの見積もりを作成する場合は、組織またはフォルダのデータ プロファイリング費用を見積もるをご覧ください。

BigQuery データのプロファイリングの詳細については、BigQuery データのデータ プロファイルをご覧ください。

概要

データ プロファイルの生成を開始する前に、見積もりを実行して、BigQuery データの量とそのデータのプロファイリングにかかる費用を把握できます。見積もりを実行するには、見積もりを作成します。

見積もりを作成するときは、プロファイリングするデータを含むリソース(組織、フォルダ、またはプロジェクト)を指定します。フィルタを設定してデータ選択を微調整できます。機密データの保護がテーブルをプロファイリングする前に満たす必要がある条件も設定できます。機密データの保護は、見積もりの作成時にデータの形状、サイズ、型に基づいて見積もりを行います。

各見積もりには、リソース内で検出された一致するテーブルの数、それらすべてのテーブルの合計サイズ、リソースを 1 回だけプロファイリングする場合と毎月プロファイリングする場合の推定費用などの詳細が含まれます。

料金の計算方法の詳細については、データ プロファイリングの料金をご覧ください。

見積もりの料金

見積もりの作成に料金は発生しません。

維持率

各見積もりは 28 日後に自動的に削除されます。

準備

データ プロファイリングの費用見積もりを作成、管理するために必要な権限を取得するには、プロジェクトで DLP 管理者roles/dlp.admin)IAM ロールの付与を管理者に依頼してください。ロールの付与の詳細については、アクセスの管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

  1. プロジェクトで Cloud Data Loss Prevention API が有効になっていることを確認します。

    1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    2. Make sure that billing is enabled for your Google Cloud project.

    3. Enable the required API.

      Enable the API

  2. データ プロファイリングの費用見積もりを作成、管理するために必要な権限を取得するには、プロジェクトで DLP 管理者roles/dlp.admin)IAM ロールの付与を管理者に依頼してください。ロールの付与の詳細については、アクセスの管理をご覧ください。

    必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

見積もりを作成する

  1. [データ プロファイルの見積もりの作成] ページに移動します。

    [データ プロファイルの見積もりの作成] に移動

  2. プロジェクトを選択します。

以降のセクションでは、[データ プロファイルの見積もりの作成] ページの手順についてさらに詳しく説明します。各セクションの最後で、[続行] をクリックします。

スキャンするリソースの選択

[プロジェクト全体をスキャン] が選択されていることを確認します。

フィルタと条件を入力する

プロジェクト内のすべての BigQuery テーブルを見積もりに含める場合は、このセクションをスキップできます。

このセクションでは、フィルタを作成して、見積もりに含めるデータまたは除外するデータの特定のサブセットを指定します。見積もりに含めるサブセットについては、サブセット内のテーブルが見積もりに含まれるために満たすべき条件も指定します。

フィルタと条件を設定するには、次の手順を行います。

  1. [フィルタと条件を追加] をクリックします。
  2. [フィルタ] セクションで、見積もりの対象範囲に含まれるテーブルを指定する 1 つ以上のフィルタを定義します。

    次のうち少なくとも 1 つを指定します。

    • 1 つ以上のプロジェクトを指定するプロジェクト ID または正規表現。
    • 1 つ以上のデータセットを指定するデータセット ID または正規表現。
    • 1 つ以上のテーブルを指定するテーブル ID または正規表現。

    正規表現は RE2 構文に基づく必要があります。

    たとえば、データセット内のすべてのテーブルをフィルタに含めるには、そのデータセットの ID を指定し、他の 2 つのフィールドを空白のままにします。

    さらにフィルタを追加する場合は、[フィルタを追加] をクリックし、前述の手順を繰り返します。

  3. フィルタで定義されたデータのサブセットを見積もりから除外する必要がある場合は、[一致するテーブルを見積もりに含める] をオフにします。このオプションをオフにすると、このセクションの残りの部分で説明する条件は非表示になります。

  4. 省略可: [条件] セクションで、一致するテーブルが見積もりに含まれるために満たす必要のある条件を指定します。この手順をスキップすると、機密データの保護には、サイズと年齢に関係なくフィルタに一致するサポートされているテーブルがすべて含まれます。

    次のオプションを構成します。

    • 最小条件: 小さいテーブルまたは新しいテーブルを見積もりから除外するには、最小行数またはテーブルの経過時間を設定します。

    • 時間条件: 古いテーブルを除外するには、時間条件をオンにします。次に、日付と時刻を選択します。この日付以前に作成されたテーブルは見積もりから除外されます。

      たとえば、時間条件を 5/4/22 11:59 PM に設定した場合、2022 年 5 月 4 日午後 11 時 59 分以前に作成されたテーブルは機密データの保護の見積もりから除外されます。

    • プロファイリングするテーブル: 見積もりに含めるテーブルのタイプを指定するには、[指定したタイプのテーブルのみを含める] を選択します。次に、含めるテーブルの種類を選択します。

      この条件をオンにしない場合、またはテーブルタイプを選択しない場合、機密データの保護はサポートされているすべてのテーブルを見積もりに含めます。

    次の構成があるとします。

    • 最小条件

      • 最小行数: 10 行
      • 最小期間: 24 時間
    • 時間条件

      • タイムスタンプ: 2022 年 5 月 4 日午後 11 時 59 分
    • プロファイリングするテーブル

      [指定したタイプのテーブルのみを含める] オプションが選択されています。テーブルタイプのリストでは、Profile BigLake テーブルのみが選択されています。

    この場合、機密データの保護は、2022 年 5 月 4 日午後 11 時 59 分以前に作成されたテーブルを除外します。この日時の後に作成されたテーブルのうち、10 行または 24 時間以上経過した BigLake テーブルのみが機密データの保護によってプロファイリングされます。

  5. [完了] をクリックします。

  6. さらにフィルタと条件を追加する場合は、[フィルタと条件を追加] をクリックし、前述の手順を繰り返します。

    フィルタと条件のリストの最後の項目には、常に [デフォルトのフィルタと条件] というラベルが付加されます。このデフォルト設定は、作成したフィルタと条件のいずれとも一致しないプロジェクト内のテーブルに適用されます。

    デフォルトのフィルタと条件
  7. デフォルトのフィルタと条件を調整する場合は、[ フィルタと条件を編集] をクリックして、必要に応じて設定を調整します。

見積もりを保存する場所の設定

  1. [リソース ロケーション] リストで、この見積もりを保存するリージョンを選択します。

    見積もりを保存する場所がどこであっても、スキャンされるデータには影響しません。また、以降のデータ プロファイルの保存場所にも影響しません。データは、BigQuery で設定されたとおり、データが保存されているリージョンと同じリージョンでスキャンされます。詳細については、データ所在地に関する検討事項をご覧ください。

  2. 設定を確認し、[作成] をクリックします。

機密データの保護で見積りが作成され、見積もりリストに追加されます。その後、見積もりが実行されます。

リソース内のデータ量に応じて、見積もりが完了するまでに最大 24 時間かかることがあります。それまでの間、[機密データの保護] ページを閉じて後で確認できます。見積もりの準備が整うと、Google Cloud コンソールに通知が表示されます。

見積もりを表示する

  1. 見積もりリストに移動します。

    見積もりに移動する

  2. 表示する見積もりをクリックします。見積もりには以下の対象が含まれます。

    • リソース内のテーブル数から、フィルタと条件で除外したテーブルを差し引いた数。
    • テーブルが対応するデータの合計量。
    • 毎月このデータ量をプロファイリングするために必要なサブスクリプション ユニットの数。
    • 最初に検出された費用。これは、検出されたテーブル プロファイリングの概算費用です。この見積もりは現在のデータのスナップショットのみに基づいており、一定期間に増加するデータの量は考慮されていません。
    • 6 か月未満、12 か月未満、または 24 か月未満のテーブルのみをプロファイリングする場合の追加費用の見積もり。これらの追加の見積もりは、データのカバー範囲をさらに制限することで、データ プロファイリングのコストをどのように制御できるかを示しています。
    • 毎月の BigQuery の使用量が、今月の使用量と同じであると仮定した場合の、データ プロファイリングの推定月間費用。
    • BigQuery の経時的な増加を示すグラフ。
    • 設定した構成の詳細。

見積もりグラフ

各見積もりには、BigQuery データの過去の増加を示すグラフが含まれます。この情報を使用して、毎月のデータ プロファイリングの費用を見積もることができます。

BigQuery データの増加を示すグラフ

次のステップ