Vertex AI の機密データ検出

このページでは、Vertex AI で使用する Sensitive Data Protection の検出について説明します。

Sensitive Data Protection の検出機能を使用すると、Vertex AI データセットに含まれるトレーニング データについて確認できます。Discovery は、検出された情報の種類(infoTypes)やトレーニング データの機密性レベルなどの分析情報を提供するデータ プロファイルを生成します。

このプレビューに参加するには、cloud-dlp-feedback@google.com にメールを送信してください。

利点

この機能には、次の利点があります。

  • Vertex AI データセットを組織レベル、フォルダレベル、プロジェクト レベルでモニタリングして、機密データがないか確認し、結果をレポートできます。
  • 検出結果を Security Command Center に送信すると、組織のセキュリティ対策を評価する際に、機密データが含まれている可能性のあるワークロードが考慮されます。
  • 検出で機密性の高いトレーニング データが検出された場合は、データ プロファイルを使用して、さらに調査が必要なリソースを特定できます。詳細な検査を実行して、リソース内のすべての機密インスタンスを検出できます。

サポートされているデータソース

この機能を使用すると、Vertex AI データセットで参照される次のタイプのトレーニング データをプロファイリングできます。

  • Cloud Storage バケット内のトレーニング データ。サポートされているファイル形式については、ファイルクラスタをご覧ください。
  • BigQuery テーブルのトレーニング データ。

仕組み

Vertex AI データセットをプロファイリングすると、トレーニング データが保存されている場所(Cloud Storage バケットまたは BigQuery テーブル)に応じて、ファイルストア データ プロファイルまたはテーブルデータ プロファイルが生成されます。データ プロファイルは、データセットに関連付けられたトレーニング データに関する分析情報とメタデータを提供します。Vertex AI データセットごとに、生成されたデータ プロファイルには次の情報が含まれます。

  • トレーニング データの機密レベルとデータリスク レベル
  • トレーニング データで検出された機密情報の種類(運転免許証 ID、メールアドレスなど)

各ファイルストア データ プロファイルの分析情報とメタデータの一覧については、ファイルストア データ プロファイルをご覧ください。

各テーブルデータ プロファイルの分析情報とメタデータの一覧については、テーブルデータ プロファイルをご覧ください。

検出サービスの詳細については、データ プロファイルをご覧ください。

料金

Vertex AI データをプロファイリングすると、選択した検出の料金モードに応じて Sensitive Data Protection の料金が発生します。

また、トレーニング データが Cloud Storage バケットにある場合、機密データの保護がトレーニング データをプロファイリングするために行うリクエストに対して Cloud Storage から料金が発生します。次のセクションでは、関連する Cloud Storage の料金について説明します。

クラス B オペレーション

Cloud Storage バケット内のトレーニング データのプロファイリング プロセスで Sensitive Data Protection が実行する Class B(storage.buckets.get)オペレーションに対して料金が発生します。

Cloud Storage でクラス B オペレーションに対して課金される料金については、Cloud Storage ドキュメントのオペレーションの料金をご覧ください。

検索料金

Standard 以外のストレージ クラスのオブジェクトには、取得料金が請求されます。Cloud Storage でのデータ取得の料金については、Cloud Storage ドキュメントの取得料金をご覧ください。

次のステップ