既知の問題

このページには、Cloud DLP の既知の問題とともに、これらの問題を回避する方法や復旧する方法が記載されています。

BigQuery のスキャン

テーブルが 1 TB を超えると、割り当ての問題を引き起こす可能性がある

DLP ジョブは 1 TB を超えるテーブルをスキャンするため、BigQuery の TableDataService.List 割り当てを使い果たし、DlpJob と同時に実行される他のワークフロー(Dataflow ワークフローなど)に悪影響を与える可能性があります。

エクスポートされた検出結果に row_number フィールドの値がない

検出結果を BigQuery に保存するように Cloud DLP を構成すると、入力テーブルのスキャン時に、生成された BigQuery テーブルの location.content_locations.record_location.record_key.big_query_key.row_number フィールドが推定されます。この値は非決定的であり、クエリされません。また、検査ジョブの場合は null になる場合があります。

結果が存在する特定の行を識別する必要がある場合は、ジョブの作成時に inspectJob.storageConfig.bigQueryOptions.identifyingFields を指定します。

識別するフィールドは、生成された BigQuery テーブルの location.content_locations.record_location.record_key.id_values フィールドで確認できます。

インテリジェントなドキュメント解析

DocumentLocation オブジェクトにデータが入力されていない

インテリジェント ドキュメント解析スキャンモードでは、location.content_locations.document_location.file_offset フィールドに値が入力されません。

BigQuery データのデータ プロファイル

このセクションでは、プレビュー版のデータ プロファイラの既知の問題と制限事項について説明します。この機能の詳細については、BigQuery データのデータ プロファイルをご覧ください。

5 億テーブルを超える組織またはプロジェクト

5 億を超えるテーブルがある組織またはプロジェクトをプロファイリングしようとすると、Cloud DLP はエラーを返します。このエラーが発生した場合は、cloud-dlp-feedback@google.com にメールでフィードバックをお送りください。

組織のテーブル数が 5 億を超え、テーブル数が少ないプロジェクトがある場合は、プロジェクト レベルのスキャンを実行します。

テーブルと列の上限については、データ プロファイリングの上限をご覧ください。

検査テンプレート

検査テンプレートは、プロファイリングするデータと同じリージョンに存在する必要があります。複数のリージョンにデータがある場合は、global リージョンに格納されている検査テンプレートを使用します。詳細については、データ所在地に関する検討事項をご覧ください。

格納される infoType

データ プロファイラは、global リージョン内に格納される infoType のみをサポートします。

プロファイルが最後に生成された日時

Cloud DLP がプロファイルを再生成できない場合、最後に成功したプロファイリング オペレーションの時間が削除されます。つまり、データ プロファイルの [前回のプロファイル生成] フィールドは空になります。

VPC Service Controls

VPC Service Controls ゾーンでのこの機能の使用は、公式にはサポートされていません。VPC Service Controls 内でデータのスキャンを試みた場合は、cloud-dlp-feedback@google.com にメールで発生した問題をお知らせください。