Hasil pemindaian dikategorikan berdasarkan seberapa besar kemungkinannya untuk mewakili kecocokan. Perlindungan Data Sensitif menggunakan representasi kemungkinan dalam bucket, yang dimaksudkan untuk menunjukkan seberapa besar kemungkinan sepotong data cocok dengan infoType tertentu.
Cara kerja kemungkinan
Saat mengonfigurasi pemindaian Perlindungan Data Sensitif, tetapkan infoType yang Anda inginkan untuk dipindai oleh Perlindungan Data Sensitif. Untuk mempersempit hasil pemindaian, Anda dapat menetapkan tingkat kemungkinan minimum dalam permintaan Anda.
Untuk setiap potensi kecocokan (penemuan) yang terdeteksi selama pemindaian, Perlindungan Data Sensitif akan menetapkan tingkat kemungkinan. Tingkat kemungkinan temuan menjelaskan seberapa besar kemungkinan temuan tersebut cocok dengan infoType yang Anda pindai. Misalnya, Perlindungan Data Sensitif mungkin menetapkan
kemungkinan LIKELY
untuk temuan yang terlihat seperti alamat email.
Saat menampilkan hasil, Perlindungan Data Sensitif akan memfilter semua temuan yang memiliki kemungkinan lebih rendah daripada tingkat kemungkinan minimum yang Anda tetapkan dalam permintaan. Misalnya, jika Anda menetapkan kemungkinan minimum ke POSSIBLE
, Anda hanya akan mendapatkan temuan yang dievaluasi sebagai POSSIBLE
, LIKELY
, dan VERY_LIKELY
. Jika Anda menetapkan kemungkinan minimum ke VERY_LIKELY
, Anda akan mendapatkan jumlah temuan terkecil.
Tingkat kemungkinan
Tabel berikut mencantumkan kemungkinan nilai yang dapat ditetapkan oleh Perlindungan Data Sensitif untuk temuan.
ENUM | Deskripsi |
---|---|
VERY_UNLIKELY |
Ditandai dengan hal berikut:
|
UNLIKELY |
Ditandai dengan hal berikut:
|
POSSIBLE |
Ditandai dengan hal berikut:
|
LIKELY |
Ditandai oleh satu atau beberapa sinyal kuat untuk infoType tertentu. Sinyal dapat mencakup checksum yang lulus, petunjuk kontekstual yang kuat, dan pemformatan yang unik dan spesifik. |
VERY_LIKELY |
Ditandai dengan memiliki banyak sinyal yang kuat untuk infoType tertentu. Sinyal dapat mencakup checksum yang lulus, petunjuk kontekstual yang kuat, dan pemformatan yang unik dan spesifik. |
Memilih tingkat kemungkinan minimum untuk hasil pemindaian
Secara umum, jika Anda menetapkan tingkat kemungkinan minimum yang lebih tinggi dalam permintaan Perlindungan Data Sensitif, hasilnya memiliki jumlah positif palsu yang lebih rendah (terkadang disebut derau). Namun, hasilnya juga dapat mengecualikan lebih banyak positif benar. Memilih tingkat kemungkinan minimum melibatkan pencarian keseimbangan yang tepat antara perolehan dan presisi.
Misalnya, ada 10 alamat dalam sebuah dokumen dan Perlindungan Data Sensitif mengidentifikasi 5 alamat. Namun, di antara temuan yang diidentifikasi oleh Perlindungan Data Sensitif, sebenarnya hanya ada 4 alamat.
- Perolehan adalah jumlah instance positif benar dari jumlah total instance yang relevan. Dalam contoh ini, perolehannya adalah 4/10.
- Presisi adalah jumlah instance positif benar dari total jumlah instance yang diidentifikasi oleh Perlindungan Data Sensitif. Dalam contoh ini, presisinya adalah 4/5.
Dalam contoh ini, presisinya tinggi tetapi perolehannya relatif rendah.
Tingkat kemungkinan minimum yang Anda tetapkan memengaruhi tingkat perolehan dan presisi yang Anda dapatkan dalam hasil pemindaian. Tabel berikut menjelaskan kapan setiap tingkat kemungkinan minimum berguna, serta bagaimana perolehan dan presisi bervariasi di setiap tingkat.
Tingkat kemungkinan minimum | Deskripsi |
---|---|
LIKELIHOOD_UNSPECIFIED |
Nilai default; sama seperti POSSIBLE . |
VERY_UNLIKELY |
Berguna jika Anda membutuhkan recall tertinggi. Tingkat kemungkinan minimum ini menghasilkan derau terbanyak. |
UNLIKELY |
Berguna jika Anda memerlukan perolehan yang lebih tinggi. Tingkat kemungkinan minimum ini menghasilkan beberapa derau. |
POSSIBLE |
Berguna jika Anda menginginkan keseimbangan presisi dan perolehan. |
LIKELY |
Berguna jika Anda memerlukan presisi yang lebih tinggi dengan mengorbankan beberapa perolehan. |
VERY_LIKELY |
Berguna jika Anda menginginkan presisi tertinggi pada pengeluaran perolehan. |
Kemungkinan minimum default
Jika Anda tidak menetapkan kemungkinan minimum dalam permintaan Anda, atau jika Anda menetapkannya ke
LIKELIHOOD_UNSPECIFIED
, Perlindungan Data Sensitif hanya akan menampilkan temuan dengan
kemungkinan POSSIBLE
dan lebih tinggi.