Kemungkinan kecocokan

Hasil pemindaian dikategorikan berdasarkan seberapa besar kemungkinannya untuk mewakili kecocokan. Perlindungan Data Sensitif menggunakan representasi kemungkinan dalam bucket, yang dimaksudkan untuk menunjukkan seberapa besar kemungkinan sepotong data cocok dengan infoType tertentu.

Cara kerja kemungkinan

Saat mengonfigurasi pemindaian Perlindungan Data Sensitif, tetapkan infoType yang Anda inginkan untuk dipindai oleh Perlindungan Data Sensitif. Untuk mempersempit hasil pemindaian, Anda dapat menetapkan tingkat kemungkinan minimum dalam permintaan Anda.

Untuk setiap potensi kecocokan (penemuan) yang terdeteksi selama pemindaian, Perlindungan Data Sensitif akan menetapkan tingkat kemungkinan. Tingkat kemungkinan temuan menjelaskan seberapa besar kemungkinan temuan tersebut cocok dengan infoType yang Anda pindai. Misalnya, Perlindungan Data Sensitif mungkin menetapkan kemungkinan LIKELY untuk temuan yang terlihat seperti alamat email.

Saat menampilkan hasil, Perlindungan Data Sensitif akan memfilter semua temuan yang memiliki kemungkinan lebih rendah daripada tingkat kemungkinan minimum yang Anda tetapkan dalam permintaan. Misalnya, jika Anda menetapkan kemungkinan minimum ke POSSIBLE, Anda hanya akan mendapatkan temuan yang dievaluasi sebagai POSSIBLE, LIKELY, dan VERY_LIKELY. Jika Anda menetapkan kemungkinan minimum ke VERY_LIKELY, Anda akan mendapatkan jumlah temuan terkecil.

Tingkat kemungkinan

Tabel berikut mencantumkan kemungkinan nilai yang dapat ditetapkan oleh Perlindungan Data Sensitif untuk temuan.

ENUM Deskripsi
VERY_UNLIKELY Ditandai dengan hal berikut:
  • Sinyal lemah.
  • Tidak adanya petunjuk kontekstual.
  • Sinyal negatif untuk infoType tertentu.
UNLIKELY Ditandai dengan hal berikut:
  • Satu atau beberapa sinyal lemah.
  • Sinyal yang lebih kuat untuk infoType lainnya.
POSSIBLE Ditandai dengan hal berikut:
  • Satu atau beberapa sinyal terhadap infoType tertentu. Sinyal dapat mencakup meneruskan {i>checksum<i}.
  • Kurangnya petunjuk kontekstual yang kuat dan format yang unik dan spesifik.
LIKELY Ditandai oleh satu atau beberapa sinyal kuat untuk infoType tertentu. Sinyal dapat mencakup checksum yang lulus, petunjuk kontekstual yang kuat, dan pemformatan yang unik dan spesifik.
VERY_LIKELY Ditandai dengan memiliki banyak sinyal yang kuat untuk infoType tertentu. Sinyal dapat mencakup checksum yang lulus, petunjuk kontekstual yang kuat, dan pemformatan yang unik dan spesifik.

Memilih tingkat kemungkinan minimum untuk hasil pemindaian

Secara umum, jika Anda menetapkan tingkat kemungkinan minimum yang lebih tinggi dalam permintaan Perlindungan Data Sensitif, hasilnya memiliki jumlah positif palsu yang lebih rendah (terkadang disebut derau). Namun, hasilnya juga dapat mengecualikan lebih banyak positif benar. Memilih tingkat kemungkinan minimum melibatkan pencarian keseimbangan yang tepat antara perolehan dan presisi.

Misalnya, ada 10 alamat dalam sebuah dokumen dan Perlindungan Data Sensitif mengidentifikasi 5 alamat. Namun, di antara temuan yang diidentifikasi oleh Perlindungan Data Sensitif, sebenarnya hanya ada 4 alamat.

  • Perolehan adalah jumlah instance positif benar dari jumlah total instance yang relevan. Dalam contoh ini, perolehannya adalah 4/10.
  • Presisi adalah jumlah instance positif benar dari total jumlah instance yang diidentifikasi oleh Perlindungan Data Sensitif. Dalam contoh ini, presisinya adalah 4/5.

Dalam contoh ini, presisinya tinggi tetapi perolehannya relatif rendah.

Tingkat kemungkinan minimum yang Anda tetapkan memengaruhi tingkat perolehan dan presisi yang Anda dapatkan dalam hasil pemindaian. Tabel berikut menjelaskan kapan setiap tingkat kemungkinan minimum berguna, serta bagaimana perolehan dan presisi bervariasi di setiap tingkat.

Tingkat kemungkinan minimum Deskripsi
LIKELIHOOD_UNSPECIFIED Nilai default; sama seperti POSSIBLE.
VERY_UNLIKELY Berguna jika Anda membutuhkan recall tertinggi. Tingkat kemungkinan minimum ini menghasilkan derau terbanyak.
UNLIKELY Berguna jika Anda memerlukan perolehan yang lebih tinggi. Tingkat kemungkinan minimum ini menghasilkan beberapa derau.
POSSIBLE Berguna jika Anda menginginkan keseimbangan presisi dan perolehan.
LIKELY Berguna jika Anda memerlukan presisi yang lebih tinggi dengan mengorbankan beberapa perolehan.
VERY_LIKELY Berguna jika Anda menginginkan presisi tertinggi pada pengeluaran perolehan.

Kemungkinan minimum default

Jika Anda tidak menetapkan kemungkinan minimum dalam permintaan Anda, atau jika Anda menetapkannya ke LIKELIHOOD_UNSPECIFIED, Perlindungan Data Sensitif hanya akan menampilkan temuan dengan kemungkinan POSSIBLE dan lebih tinggi.