Dengan menggunakan aturan kata cepat, Anda dapat memperluas detektor infoType bawaan dan kustom lebih lanjut dengan aturan konteks yang andal. Aturan kata cepat memerintahkan Perlindungan Data Sensitif untuk menyesuaikan kemungkinan temuan, bergantung pada apakah kata cepat muncul di dekat temuan tersebut. Aturan kata kunci adalah jenis aturan inspeksi, yang ditentukan dalam kumpulan aturan. Setiap aturan diterapkan ke serangkaian infoType bawaan atau kustom.
Anatomi aturan frasa pengaktif
Detektor infoType dapat memiliki nol atau beberapa aturan frasa pengaktif. Dalam
konfigurasi inspeksi, Anda
menentukan setiap objek HotwordRule
di dalam array rules
, sebagai berikut:
"rules":[
{
"hotwordRule":{
"hotwordRegex":{
"pattern":"REGEX_PATTERN"
},
"proximity":{
"windowAfter":"NUM_CHARS_TO_CONSIDER_AFTER_FINDING",
"windowBefore":"NUM_CHARS_TO_CONSIDER_BEFORE_FINDING"
}
"likelihoodAdjustment":{
"fixedLikelihood":"LIKELIHOOD_VALUE"
-- OR --
"relativeLikelihood":"LIKELIHOOD_ADJUSTMENT"
},
}
},
...
]
Ganti kode berikut:
- REGEX_PATTERN: ekspresi reguler
(objek
Regex
) yang menentukan apa yang memenuhi syarat sebagai kata kunci panas. - NUM_CHARS_TO_CONSIDER_AFTER_FINDING: rentang karakter setelah penemuan. Perlindungan Data Sensitif menganalisis rentang ini untuk menentukan apakah kata cepat terjadi di dekat temuan.
NUM_CHARS_TO_CONSIDER_BEFORE_FINDING: rentang karakter sebelum penemuan. Perlindungan Data Sensitif menganalisis rentang ini untuk menentukan apakah kata cepat terjadi di dekat temuan.
LIKELIHOOD_VALUE: tingkat
Likelihood
tetap untuk menetapkan temuan.LIKELIHOOD_ADJUSTMENT: angka yang menunjukkan seberapa banyak Perlindungan Data Sensitif harus meningkatkan atau menurunkan kemungkinan temuan. Bilangan bulat positif akan meningkatkan tingkat kemungkinan, dan bilangan bulat negatif akan menurunkannya. Misalnya, jika temuan akan menjadi
POSSIBLE
tanpa aturan deteksi danrelativeLikelihood
adalah 1, temuan akan diupgrade keLIKELY
. JikarelativeLikelihood
adalah -1, temuan akan diturunkan keUNLIKELY
. Kemungkinan tidak akan pernah turun di bawahVERY_UNLIKELY
atau melebihiVERY_LIKELY
. Dalam kasus ini, tingkat kemungkinan tetap sama. Misalnya, jika kemungkinan dasar adalahVERY_LIKELY
danrelativeLikelihood
adalah 1, kemungkinan akhir tetapVERY_LIKELY
.
Contoh frasa pengaktif: Mencocokkan nomor rekam medis
Misalnya, Anda ingin mendeteksi infoType kustom seperti nomor rekam medis (MRN) dalam bentuk "###-#-#####". Selain itu, Anda ingin Perlindungan Data Sensitif meningkatkan kemungkinan kecocokan setiap temuan yang mengikuti kata kunci "MRN".
Contoh nilai:
- 123-4-56789 akan cocok dengan
POSSIBLE
. - MRN 123-4-56789 akan cocok dengan
VERY_LIKELY
.
Contoh JSON dan cuplikan kode berikut menunjukkan cara mengonfigurasi aturan kata kunci panas. Contoh ini menggunakan pendeteksi ekspresi reguler kustom.
Dalam contoh ini, perhatikan hal berikut:
- Permintaan menentukan infoType kustom
C_MRN
, yang merupakan pendeteksi untuk string apa pun yang cocok dengan ekspresi reguler[0-9]{3}-[0-9]{1}-[0-9]{5}
. - Ekspresi reguler
(?i)(mrn|medical)(?-i)
menentukan frasa pengaktif. Perlindungan Data Sensitif menelusuri kata kunci panas ini dalam rentang karakter yang ditentukan di kolomproximity
. - Untuk setiap temuan
C_MRN
yang memiliki kata kunci dalamproximity
yang ditetapkan, Perlindungan Data Sensitif menetapkan tingkat kemungkinan keVERY_LIKELY
.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Lihat panduan memulai JSON untuk mengetahui informasi selengkapnya tentang penggunaan DLP API dengan JSON.
Metode dan URL HTTP:
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/content:inspect
Ganti PROJECT_ID
dengan project ID.
Input JSON:
{
"item":{
"value":"Patient's MRN 444-5-22222 and just a number 333-2-33333"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[0-9]{3}-[0-9]{1}-[0-9]{5}"
},
"likelihood":"POSSIBLE",
}
],
"ruleSet":[
{
"infoTypes": [{"name" : "C_MRN"}],
"rules":[
{
"hotwordRule":{
"hotwordRegex":{
"pattern":"(?i)(mrn|medical)(?-i)"
},
"likelihoodAdjustment":{
"fixedLikelihood":"VERY_LIKELY"
},
"proximity":{
"windowBefore":10
}
}
}
]
}
]
}
}
Output JSON (disingkat):
{ "result": { "findings": [ { "infoType": { "name": "C_MRN" }, "likelihood": "VERY_LIKELY", "location": { "byteRange": { "start": "14", "end": "25" }, "codepointRange": { ... } } }, { "infoType": { "name": "C_MRN" }, "likelihood": "POSSIBLE", "byteRange": { "start": "44", "end": "55" }, "codepointRange": { ... } } } ] } }
Output menunjukkan bahwa Perlindungan Data Sensitif telah
mengidentifikasi nomor rekam medis dengan benar menggunakan detektor infoType kustom C_MRN
.
Selain itu, karena pencocokan konteks
dalam aturan kata kunci panas, Perlindungan Data Sensitif menetapkan kemungkinan VERY_LIKELY
, seperti yang dikonfigurasi, pada hasil pertama—yang
memiliki MRN dalam proximity
yang ditetapkan. Temuan kedua
tidak memiliki konteks, sehingga likelihood
tetap berada di POSSIBLE
.
Contoh kata kunci panas: Menetapkan kemungkinan pencocokan kolom tabel
Contoh ini menunjukkan cara menetapkan kemungkinan kecocokan dari seluruh kolom data. Pendekatan ini berguna, misalnya, jika Anda ingin mengecualikan kolom data dari hasil inspeksi.
Pertimbangkan tabel berikut. Satu kolom berisi placeholder Nomor Jaminan Sosial (SSN), dan kolom lainnya berisi SSN yang sebenarnya.
Nomor Jaminan Sosial Palsu | Nomor Jaminan Sosial yang Sebenarnya |
---|---|
111-11-1111 | 222-22-2222 |
Untuk meminimalkan derau dalam hasil pemeriksaan, Anda dapat mengecualikan temuan apa pun di
kolom Fake Social Security Number
. Tetapkan tingkat kemungkinan rendah ke kolom
ini. Kemudian, konfigurasikan permintaan sehingga kecocokan dengan tingkat kemungkinan tersebut
dikecualikan dari hasil.
Dalam contoh ini, perhatikan hal berikut:
- Aturan frasa pengaktif diterapkan ke infoType
US_SOCIAL_SECURITY_NUMBER
. - Ekspresi reguler kata kunci panas
(Fake Social Security Number)
berisi nama kolom yang memiliki nilai placeholder. - Properti
windowBefore
ditetapkan ke 1, yang berarti kata kunci panas berada di header kolom, dan temuan harus berada di kolom. - Untuk setiap temuan
US_SOCIAL_SECURITY_NUMBER
di kolom ini, Perlindungan Data Sensitif menetapkan tingkat kemungkinan keVERY_UNLIKELY
. - Properti
minLikelihood
ditetapkan kePOSSIBLE
, yang berarti bahwa setiap temuan yang memiliki tingkat kemungkinan lebih rendah dariPOSSIBLE
akan dikecualikan dari hasil inspeksi.
Lihat panduan memulai JSON untuk mengetahui informasi selengkapnya tentang penggunaan DLP API dengan JSON.
Metode dan URL HTTP:
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/content:inspect
Ganti PROJECT_ID
dengan project ID.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Input JSON:{
"item": {
"table": {
"headers": [
{
"name": "Fake Social Security Number"
},
{
"name": "Real Social Security Number"
}
],
"rows": [
{
"values": [
{
"stringValue": "111-11-1111"
},
{
"stringValue": "222-22-2222"
}
]
}
]
}
},
"inspectConfig": {
"infoTypes": [
{
"name": "US_SOCIAL_SECURITY_NUMBER"
}
],
"includeQuote": true,
"ruleSet": [
{
"infoTypes": [
{
"name": "US_SOCIAL_SECURITY_NUMBER"
}
],
"rules": [
{
"hotwordRule": {
"hotwordRegex": {
"pattern": "(Fake Social Security Number)"
},
"likelihoodAdjustment": {
"fixedLikelihood": "VERY_UNLIKELY"
},
"proximity": {
"windowBefore": 1
}
}
}
]
}
],
"minLikelihood": "POSSIBLE"
}
}
Output JSON:
{ "result": { "findings": [ { "quote": "222-22-2222", "infoType": { "name": "US_SOCIAL_SECURITY_NUMBER" }, "likelihood": "VERY_LIKELY", "location": { "byteRange": { "end": "11" }, "codepointRange": { "end": "11" }, "contentLocations": [ { "recordLocation": { "fieldId": { "name": "Real Social Security Number" }, "tableLocation": {} } } ] }, "createTime": "TIMESTAMP", "findingId": "TIMESTAMP" } ] } }
Nilai 111-11-1111, yang ada di kolom Fake Social Security Number
, cocok dengan aturan kata kunci sensitif, sehingga Perlindungan Data Sensitif menetapkan tingkat kemungkinan VERY_UNLIKELY
untuknya . Tingkat ini lebih rendah dari kemungkinan minimum
yang ditetapkan dalam konfigurasi pemeriksaan (POSSIBLE
), sehingga temuan ini
dikecualikan dari hasil pemeriksaan.
Anda dapat bereksperimen dengan contoh ini dengan menghapus kumpulan aturan. Perhatikan bahwa Sensitive Data Protection menyertakan 111-11-1111 dalam hasilnya.