Cloud Data Loss Prevention (Cloud DLP) kini menjadi bagian dari Sensitive Data Protection. Nama API tetap sama: Cloud Data Loss Prevention API (DLP API). Untuk informasi tentang layanan yang membentuk Perlindungan Data Sensitif, lihat Ringkasan Perlindungan Data Sensitif.

Halaman ini diterjemahkan oleh Cloud Translation API.

Menghitung k-map untuk set data

Peta K sangat mirip dengan k-anonimitas k, kecuali karena mengasumsikan bahwa penyerang kemungkinan besar tidak mengetahui siapa yang ada dalam set data. Gunakan peta k jika set data Anda relatif kecil, atau jika tingkat upaya yang diperlukan untuk menggeneralisasi atribut terlalu tinggi.

Sama seperti k-anonimitas, k-peta mengharuskan Anda menentukan kolom mana dalam database Anda yang merupakan pengidentifikasi semu. Dengan melakukan hal ini, Anda menyatakan data apa yang kemungkinan besar akan digunakan penyerang untuk mengidentifikasi ulang subjek. Selain itu, penghitungan nilai peta k memerlukan set data identifikasi ulang: tabel yang lebih besar untuk membandingkan baris dalam set data asli.

Topik ini menunjukkan cara menghitung nilai peta k untuk set data menggunakan Sensitive Data Protection. Untuk mengetahui informasi selengkapnya tentang peta k atau analisis risiko secara umum, lihat topik konsep analisis risiko sebelum melanjutkan.

Sebelum memulai

Sebelum melanjutkan, pastikan Anda telah melakukan hal berikut:

Login ke Akun Google Anda.
Di konsol Google Cloud , pada halaman pemilih project, pilih atau buat project Google Cloud .

Buka pemilih project

Pastikan penagihan diaktifkan untuk Google Cloud project Anda. Pelajari cara mengonfirmasi bahwa penagihan diaktifkan untuk project Anda.
Aktifkan Sensitive Data Protection.

Mengaktifkan Sensitive Data Protection

Pilih set data BigQuery yang akan dianalisis. Sensitive Data Protection memperkirakan metrik peta k dengan memindai tabel BigQuery.
Tentukan jenis set data yang ingin Anda gunakan untuk memodelkan set data serangan. Untuk mengetahui informasi selengkapnya, lihat halaman referensi untuk objek KMapEstimationConfig, serta Istilah dan teknik analisis risiko.

Menghitung perkiraan peta k

Anda dapat memperkirakan nilai peta k menggunakan Perlindungan Data Sensitif, yang menggunakan model statistik untuk memperkirakan set data identifikasi ulang. Hal ini berbeda dengan metode analisis risiko lainnya, yang secara eksplisit mengetahui set data serangan. Bergantung pada jenis datanya, Perlindungan Data Sensitif menggunakan set data yang tersedia secara publik (misalnya, dari US Census) atau model statistik kustom (misalnya, satu atau beberapa tabel BigQuery yang Anda tentukan), atau mengekstrapolasi dari distribusi nilai dalam set data input Anda. Untuk informasi selengkapnya, lihat halaman referensi untuk objek KMapEstimationConfig.

Untuk menghitung estimasi peta k menggunakan Perlindungan Data Sensitif, konfigurasikan terlebih dahulu tugas risiko. Buat permintaan ke resource projects.dlpJobs, dengan PROJECT_ID menunjukkan ID project Anda:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

Permintaan berisi objek RiskAnalysisJobConfig, yang terdiri dari berikut ini:

Objek PrivacyMetric. Di sinilah Anda menentukan bahwa Anda ingin menghitung peta k dengan menentukan objek KMapEstimationConfig yang berisi hal berikut:
- quasiIds[]: Wajib diisi. Kolom (objek TaggedField) yang dianggap sebagai quasi-identifier untuk dipindai dan digunakan untuk menghitung k-map. Tidak ada dua kolom yang dapat memiliki tag yang sama. Nilainya dapat berupa salah satu dari berikut:
  - infoType: Hal ini menyebabkan Sensitive Data Protection menggunakan set data publik yang relevan sebagai model statistik populasi, termasuk kode pos AS, kode wilayah, usia, dan jenis kelamin.
  - infoType kustom: Tag kustom tempat Anda menunjukkan tabel tambahan (objek AuxiliaryTable) yang berisi informasi statistik tentang kemungkinan nilai kolom ini.
  - Tag inferred: Jika tidak ada tag semantik yang ditunjukkan, tentukan inferred. Sensitive Data Protection menyimpulkan model statistik dari distribusi nilai dalam data input.
- regionCode: Kode wilayah alpha-2 ISO 3166-1 yang akan digunakan Perlindungan Data Sensitif dalam pemodelan statistik. Nilai ini wajib diisi jika tidak ada kolom yang diberi tag dengan infoType khusus wilayah (misalnya, kode pos AS) atau kode wilayah.
- auxiliaryTables[]: Tabel tambahan (objek AuxiliaryTable) yang akan digunakan dalam analisis. Setiap tag kustom yang digunakan untuk memberi tag pada kolom kuasi-ID (dari quasiIds[]) harus muncul di tepat satu kolom dari satu tabel tambahan.
Objek BigQueryTable. Tentukan tabel BigQuery yang akan dipindai dengan menyertakan semua hal berikut:
- projectId: Project ID project yang berisi tabel.
- datasetId: ID set data tabel.
- tableId: Nama tabel.
Kumpulan satu atau beberapa objek Action, yang merepresentasikan tindakan yang akan dijalankan, dalam urutan yang diberikan, setelah penyelesaian tugas. Setiap objek Action dapat berisi salah satu tindakan berikut:
- SaveFindings object: Menyimpan hasil pemindaian analisis risiko ke tabel BigQuery.
- PublishToPubSub object: Memublikasikan notifikasi ke topik Pub/Sub.
Catatan: Jika ada masalah konfigurasi atau izin dengan topik Pub/Sub, Sensitive Data Protection akan mencoba lagi mengirim notifikasi Pub/Sub hingga dua minggu. Setelah dua minggu, notifikasi akan dihapus.
- PublishSummaryToCscc object: Menyimpan ringkasan hasil ke Security Command Center.
- PublishFindingsToCloudDataCatalog object: Menyimpan hasil ke Data Catalog.
- JobNotificationEmails objek: Mengirimi Anda email berisi hasil.
- PublishToStackdriver object: Menyimpan hasil ke Google Cloud Observability.

Contoh kode

Berikut adalah contoh kode dalam beberapa bahasa yang menunjukkan cara menggunakan Perlindungan Data Sensitif untuk menghitung nilai peta k.