Menghitung keberadaan desier untuk set data

Kehadiran delta (kehadiran DIV) adalah metrik yang mengukur probabilitas bahwa individu berada dalam set data yang dianalisis. Seperti k-map, Anda dapat memperkirakan nilai kehadiran /* menggunakan Perlindungan Data Sensitif, yang menggunakan model statistik untuk memperkirakan set data serangan.

Kehadiran ketika kontras dengan metode analisis risiko lainnya, yang set data serangan secara eksplisit diketahui. Bergantung pada jenis datanya, Perlindungan Data Sensitif menggunakan set data yang tersedia untuk publik (misalnya, dari Sensus AS) atau model statistik kustom (misalnya, satu atau beberapa tabel BigQuery yang Anda tentukan), atau mengekstrapolasi dari distribusi nilai dalam set data input Anda.

Topik ini menunjukkan cara menghitung nilai kehadiran CTR untuk set data menggunakan Perlindungan Data Sensitif. Untuk mengetahui informasi selengkapnya tentang kehadiran /* atau analisis risiko secara umum, lihat topik konsep analisis risiko sebelum melanjutkan.

Sebelum memulai

Sebelum melanjutkan, pastikan Anda telah melakukan hal berikut:

  1. Login ke Akun Google Anda.
  2. Di Konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
  3. Buka pemilih project
  4. Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda. Pelajari cara mengonfirmasi bahwa penagihan diaktifkan untuk project Anda.
  5. Aktifkan Perlindungan Data Sensitif.
  6. Aktifkan Perlindungan Data Sensitif

  7. Pilih {i>dataset<i} BigQuery untuk dianalisis. Perlindungan Data Sensitif memperkirakan metrik kehadiran ketika dengan memindai tabel BigQuery.
  8. Tentukan jenis set data yang ingin Anda gunakan untuk membuat model set data serangan. Untuk informasi selengkapnya, lihat halaman referensi untuk objek DeltaPresenceEstimationConfig, serta Istilah dan teknik analisis risiko.

Menghitung metrik kehadiran DIV

Untuk menghitung estimasi kehadiran goritma menggunakan Perlindungan Data Sensitif, kirim permintaan ke URL berikut, dengan PROJECT_ID menunjukkan ID project Anda:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

Permintaan berisi objek RiskAnalysisJobConfig, yang terdiri dari hal berikut:

  • Objek PrivacyMetric. Di sinilah Anda menentukan bahwa Anda ingin menghitung kehadiran /* dengan menentukan objek DeltaPresenceEstimationConfig yang berisi hal berikut:

    • quasiIds[]: Wajib diisi. Kolom (objek QuasiId ) yang dianggap sebagai ID kuasi untuk dipindai dan digunakan untuk menghitung kehadiran /*. Dua kolom tidak boleh memiliki tag yang sama. Peristiwa tersebut dapat berupa salah satu dari hal berikut:

      • infoType: Hal ini menyebabkan Perlindungan Data Sensitif menggunakan set data publik yang relevan sebagai model statistik populasi, termasuk kode pos, kode wilayah, usia, dan gender AS.
      • InfoType kustom: Tag kustom tempat Anda menunjukkan tabel tambahan (objek AuxiliaryTable) yang berisi informasi statistik tentang kemungkinan nilai kolom ini.
      • Tag inferred: Jika tidak ada tag semantik yang ditunjukkan, tentukan inferred. Perlindungan Data Sensitif menyimpulkan model statistik dari distribusi nilai dalam data input.
    • regionCode: Kode wilayah ISO 3166-1 alpha-2 untuk Perlindungan Data Sensitif yang akan digunakan dalam pemodelan statistik. Nilai ini diperlukan jika tidak ada kolom yang diberi tag dengan infoType spesifik per wilayah (misalnya, kode pos AS) atau kode wilayah.

    • auxiliaryTables[]: Tabel tambahan (objek StatisticalTable ) untuk digunakan dalam analisis. Setiap tag kustom yang digunakan untuk memberi tag pada kolom ID semu (dari quasiIds[]) harus muncul tepat di satu kolom dari satu tabel tambahan.

  • Objek BigQueryTable. Tentukan tabel BigQuery yang akan dipindai dengan menyertakan semua hal berikut:

    • projectId: ID project dari project yang berisi tabel.
    • datasetId: ID set data dari tabel.
    • tableId: Nama tabel.
  • Kumpulan satu atau beberapa objek Action, yang mewakili tindakan yang akan dijalankan, dalam urutan yang ditentukan pada penyelesaian tugas. Setiap objek Action dapat berisi salah satu tindakan berikut:

Melihat hasil lowongan kehadiran roda

Untuk mengambil hasil tugas analisis risiko kehadiran DIV menggunakan REST API, kirim permintaan GET berikut ke resource projects.dlpJobs. Ganti PROJECT_ID dengan project ID Anda dan JOB_ID dengan ID tugas yang ingin Anda dapatkan hasilnya. ID tugas ditampilkan saat Anda memulai tugas, dan juga dapat diambil dengan mencantumkan semua tugas.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

Permintaan menampilkan objek JSON yang berisi instance tugas. Hasil analisis ada di dalam kunci "riskDetails", dalam objek AnalyzeDataSourceRiskDetails. Untuk mengetahui informasi selengkapnya, lihat referensi API untuk resource DlpJob.

Langkah selanjutnya

  • Pelajari cara menghitung nilai k-anonymity untuk set data.
  • Pelajari cara menghitung nilai l-beragam untuk set data.
  • Pelajari cara menghitung nilai k-map untuk set data.