Dokumen ini menjelaskan cara memeriksa tabel BigQuery untuk menemukan data sensitif dan mengirimkan hasil pemeriksaan ke Dataplex Universal Catalog. Tindakan ini secara otomatis menambahkan aspek ke entri Dataplex Universal Catalog yang terkait dengan tabel BigQuery Anda.
Dokumen ini juga memberikan contoh kueri yang dapat Anda gunakan untuk menemukan data di seluruh organisasi dan project dengan nilai aspek tertentu.
Fitur ini berguna jika Anda ingin memperkaya metadata di Dataplex Universal Catalog dengan klasifikasi data sensitif dari tugas inspeksi Sensitive Data Protection.
Aspek yang dihasilkan mencakup detail berikut:
- Nama tugas pemeriksaan
- Jenis informasi (infoTypes) yang terdeteksi dalam tabel
Tentang Katalog Universal Dataplex
Dataplex Universal Catalog menyediakan inventaris terpadu untuk Google Cloud resource.
Dataplex Universal Catalog memungkinkan Anda menggunakan aspek untuk menambahkan metadata bisnis dan teknis ke data Anda guna mendapatkan konteks dan pengetahuan tentang resource Anda. Kemudian, Anda dapat menelusuri dan menemukan data di seluruh organisasi serta mengaktifkan tata kelola data atas aset data Anda. Untuk mengetahui informasi selengkapnya, lihat Aspek.
Cara kerjanya
Untuk membuat aspek Dataplex Universal Catalog secara otomatis berdasarkan hasil tugas inspeksi, ikuti alur kerja tingkat tinggi berikut:
Buat atau edit tugas inspeksi yang memeriksa tabel BigQuery. Untuk mengetahui petunjuknya, lihat Memeriksa tabel BigQuery.
Pada langkah Tambahkan tindakan, aktifkan Publikasikan ke Dataplex Universal Catalog.
Perlindungan Data Sensitif menambahkan atau memperbarui aspek
Sensitive Data Protection job result
dari entri Dataplex Universal Catalog yang terkait dengan
tabel BigQuery. Kemudian, Anda dapat menelusuri
Dataplex Universal Catalog untuk menemukan semua data di organisasi atau project Anda
dengan nilai aspek tertentu. Untuk contoh kueri, lihat Contoh kueri penelusuran dalam dokumen ini.
Aspek Dataplex Universal Catalog yang dihasilkan disimpan dalam project dan region yang sama dengan tabel BigQuery.
Kolom aspek
Aspek Sensitive Data Protection job result
memiliki kolom berikut:
- Nama Lowongan
- Nama resource lengkap tugas pemeriksaan—misalnya,
projects/example-project/locations/us/dlpJobs/i-8992079400000000000
. - Jumlah InfoType
- Nama infoType yang dicari oleh tugas inspeksi—seperti yang ditentukan dalam konfigurasi inspeksi—dan jumlah temuan untuk setiap infoType.
InfoType yang tidak memiliki temuan memiliki jumlah
0
. - Waktu Berakhir
- Tanggal dan waktu berakhirnya tugas pemeriksaan.
- Adalah Pemindaian Penuh
- Apakah tugas pemeriksaan memindai semua baris dalam tabel. Jika pengambilan sampel diaktifkan dalam tugas pemeriksaan, misalnya, nilai kolom ini adalah
False
. - Memiliki Temuan
- Apakah tugas pemeriksaan mendeteksi infoType yang dipindai.
Mengaktifkan Dataplex API
Dataplex API harus diaktifkan di setiap project yang berisi data yang ingin Anda tambahkan aspeknya. Bagian ini menjelaskan cara mengaktifkan Dataplex API dalam satu project atau di semua project dalam organisasi atau folder.
Mengaktifkan Dataplex API dalam satu project
Pilih project tempat Anda ingin mengaktifkan Dataplex API.
-
Enable the Dataplex API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles.
Mengaktifkan Dataplex API di semua project dalam organisasi atau folder
Bagian ini menyediakan skrip yang menelusuri semua project dalam organisasi atau folder dan mengaktifkan Dataplex API di setiap project tersebut.
Untuk mendapatkan izin yang Anda perlukan guna mengaktifkan Dataplex API di semua project dalam organisasi atau folder, minta administrator Anda untuk memberikan peran IAM berikut:
-
Cloud Asset Viewer (
roles/cloudasset.viewer
) di organisasi atau folder -
Pengguna DLP (
roles/dlp.user
) di setiap project tempat Anda ingin mengaktifkan Dataplex API
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk mengaktifkan Dataplex API di semua project dalam organisasi atau folder. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk mengaktifkan Dataplex API di semua project dalam organisasi atau folder:
-
Untuk menelusuri semua project dalam organisasi atau folder:
cloudasset.assets.searchAllResources
di organisasi atau folder -
Untuk mengaktifkan Dataplex API:
serviceusage.services.use
di setiap project tempat Anda ingin mengaktifkan Dataplex API
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Untuk mengaktifkan Dataplex API di semua project dalam organisasi atau folder, ikuti langkah-langkah berikut:
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
Jalankan skrip berikut:
#!/bin/bash RESOURCE_ID="RESOURCE_ID" gcloud asset search-all-resources \ --scope="RESOURCE_TYPE/$RESOURCE_ID" \ --asset-types="cloudresourcemanager.googleapis.com/Project" \ --format="value(name)" | while read project_name; do project_id=$(echo "$project_name" | sed 's|.*/||') gcloud services enable "dataplex.googleapis.com" --project="$project_id" done
Ganti kode berikut:
RESOURCE_ID
: nomor organisasi atau nomor folder resource yang berisi projectRESOURCE_TYPE
: jenis resource yang berisi project—organizations
ataufolders
-
Dataplex Catalog Viewer (
roles/dataplex.catalogViewer
) -
BigQuery Data Viewer (
roles/bigquery.dataViewer
) -
Melihat entri Dataplex Universal Catalog:
-
dataplex.entries.list
-
dataplex.entries.get
-
-
Melihat set data dan tabel BigQuery:
-
bigquery.datasets.get
-
bigquery.tables.get
-
-
Di konsol Google Cloud , buka halaman Create job or job trigger.
- Pilih project Anda.
- Masukkan detail tugas pemeriksaan yang diperlukan dan detail tabel BigQuery yang ingin Anda periksa. Untuk mengetahui petunjuknya, lihat Memeriksa tabel BigQuery. Untuk mengetahui daftar lengkap jenis informasi yang dapat diperiksa oleh Sensitive Data Protection, lihat Referensi detektor InfoType.
- Untuk Tambahkan tindakan, aktifkan Publikasikan ke Dataplex Universal Catalog.
- Klik Buat. Tugas akan segera dijalankan.
-
PROJECT_ID
: Google Cloud Project ID Anda. ID project adalah string alfanumerik -
LOCATION
: region atau multi-region tempat Anda ingin memproses permintaan—misalnya,europe-west1
atauus
. Untuk lokasi yang tersedia, lihat Lokasi Perlindungan Data Sensitif. -
BIGQUERY_DATASET_NAME
: nama set data BigQuery yang berisi tabel yang akan diperiksa -
BIGQUERY_TABLE_NAME
: nama tabel BigQuery yang akan diperiksa
Peran dan izin untuk melihat aspek
Untuk mendapatkan izin yang diperlukan untuk menelusuri aspek yang terkait dengan tabel BigQuery Anda, minta administrator Anda untuk memberi Anda peran IAM berikut pada tabel:
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk menelusuri aspek yang terkait dengan tabel BigQuery Anda. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk menelusuri aspek yang terkait dengan tabel BigQuery Anda:
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Untuk mengetahui informasi selengkapnya tentang izin yang diperlukan untuk menggunakan Dataplex Universal Catalog, lihat Izin IAM Dataplex Universal Catalog.
Mengonfigurasi dan menjalankan tugas inspeksi Sensitive Data Protection
Anda dapat mengonfigurasi dan menjalankan tugas inspeksi Perlindungan Data Sensitif menggunakan konsol Google Cloud atau DLP API.
Konsol
REST
Contoh berikut mengirimkan permintaan
projects.locations.dlpJobs.create
untuk memeriksa tabel BigQuery dan mengirimkan hasilnya ke
Dataplex Universal Catalog.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
Metode HTTP dan URL:
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/dlpJobs
Meminta isi JSON:
{ "inspectJob": { "storageConfig": { "bigQueryOptions": { "tableReference": { "projectId": "PROJECT_ID", "datasetId": "BIGQUERY_DATASET_NAME", "tableId": "BIGQUERY_TABLE_NAME" } } }, "inspectConfig": { "infoTypes": [ { "name": "EMAIL_ADDRESS" }, { "name": "PERSON_NAME" }, { "name": "US_SOCIAL_SECURITY_NUMBER" }, { "name": "PHONE_NUMBER" } ], "includeQuote": true, "minLikelihood": "UNLIKELY", "limits": { "maxFindingsPerRequest": 100 } }, "actions": [ { "publishFindingsToDataplexCatalog": {} } ] } }
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan melihat respons JSON seperti berikut:
{ "name": "projects/PROJECT_ID/locations/LOCATION/dlpJobs/JOB_ID", "type": "INSPECT_JOB", "state": "PENDING", "inspectDetails": { "requestedOptions": { "snapshotInspectTemplate": {}, "jobConfig": { "storageConfig": { "bigQueryOptions": { "tableReference": { "projectId": "PROJECT_ID", "datasetId": "BIGQUERY_DATASET_NAME", "tableId": "BIGQUERY_TABLE_NAME" } } }, "inspectConfig": { "infoTypes": [ { "name": "EMAIL_ADDRESS" }, { "name": "PERSON_NAME" }, { "name": "US_SOCIAL_SECURITY_NUMBER" }, { "name": "PHONE_NUMBER" } ], "minLikelihood": "UNLIKELY", "limits": { "maxFindingsPerRequest": 100 }, "includeQuote": true }, "actions": [ { "publishFindingsToDataplexCatalog": {} } ] } }, "result": {} }, "createTime": "2025-09-09T00:29:55.951374Z", "lastModified": "2025-09-09T00:29:58.022967Z" }
Untuk mengetahui informasi tentang cara mendapatkan hasil tugas inspeksi menggunakan DLP API, lihat Mendapatkan tugas.
Contoh kueri penelusuran
Bagian ini memberikan contoh kueri penelusuran yang dapat Anda gunakan di Dataplex Universal Catalog untuk menemukan data di organisasi atau project Anda dengan nilai aspek tertentu.
Anda hanya dapat menemukan data yang aksesnya Anda miliki. Akses data dikontrol melalui izin IAM. Untuk mengetahui informasi selengkapnya, lihat Peran dan izin untuk melihat aspek dalam dokumen ini.
Anda dapat memasukkan contoh kueri ini di kolom Search di halaman Search Dataplex Universal Catalog.
Untuk mengetahui informasi tentang cara membuat kueri, lihat Sintaksis penelusuran untuk Dataplex Universal Catalog.
Temukan entri semua tabel yang memiliki aspek hasil tugas Sensitive Data Protection
aspect:sensitive-data-protection-job-result
Menemukan entri tabel yang diperiksa yang memiliki temuan
aspect:sensitive-data-protection-job-result.hasFindings=True
Menemukan entri tabel yang diperiksa yang tidak memiliki temuan
aspect:sensitive-data-protection-job-result.hasFindings=False
Menemukan entri tabel yang diperiksa sepenuhnya
Kueri berikut menampilkan entri tabel yang diperiksa baris demi baris oleh Perlindungan Data Sensitif.
aspect:sensitive-data-protection-job-result.isFullScan=True
Menemukan entri tabel yang tidak diperiksa sepenuhnya
Kueri berikut menampilkan entri tabel yang diperiksa oleh Perlindungan Data Sensitif melalui pengambilan sampel.
aspect:sensitive-data-protection-job-result.isFullScan=False