Dengan menggunakan aturan frasa pengaktif, Anda dapat lebih memperluas lagi pendeteksi infoType bawaan dan kustom dengan aturan konteks yang andal. Aturan frasa pengaktif menginstruksikan Perlindungan Data Sensitif untuk menyesuaikan kemungkinan temuan, bergantung pada apakah frasa pengaktif muncul di dekat penemuan tersebut. Aturan frasa pengaktif adalah sejenis aturan pemeriksaan, yang ditentukan dalam kumpulan aturan. Setiap aturan diterapkan ke kumpulan infoType kustom atau bawaan.
Anatomi aturan frasa pengaktif
Pendeteksi infoType dapat memiliki nol atau beberapa aturan frasa pengaktif. Dalam
konfigurasi pemeriksaan, tentukan setiap objek HotwordRule
di dalam array rules
, sebagai berikut:
"rules":[
{
"hotwordRule":{
"hotwordRegex":{
"pattern":"REGEX_PATTERN"
},
"proximity":{
"windowAfter":"NUM_CHARS_TO_CONSIDER_AFTER_FINDING",
"windowBefore":"NUM_CHARS_TO_CONSIDER_BEFORE_FINDING"
}
"likelihoodAdjustment":{
"fixedLikelihood":"LIKELIHOOD_VALUE"
-- OR --
"relativeLikelihood":"LIKELIHOOD_ADJUSTMENT"
},
}
},
...
]
Ganti kode berikut:
- REGEX_PATTERN: ekspresi reguler
(objek
Regex
) yang menentukan hal yang memenuhi syarat sebagai frasa pengaktif. - NUM_CHARS_TO_CONSIDER_AFTER_FINDING: rentang karakter setelah penemuan. Perlindungan Data Sensitif menganalisis rentang ini untuk menentukan apakah frasa pengaktif muncul di dekat temuan.
NUM_CHARS_TO_CONSIDER_BEFORE_FINDING: rentang karakter sebelum penemuan. Perlindungan Data Sensitif menganalisis rentang ini untuk menentukan apakah frasa pengaktif muncul di dekat temuan.
LIKELIHOOD_VALUE: tingkat
Likelihood
tetap untuk menetapkan temuan.LIKELIHOOD_ADJUSTMENT: angka yang menunjukkan seberapa besar perlindungan Data Sensitif harus meningkatkan atau mengurangi kemungkinan temuan. Bilangan bulat positif meningkatkan tingkat kemungkinan, dan bilangan bulat negatif menguranginya. Misalnya, jika temuan adalah
POSSIBLE
tanpa aturan deteksi danrelativeLikelihood
adalah 1, temuan tersebut akan diupgrade keLIKELY
. JikarelativeLikelihood
adalah -1, temuan tersebut akan didowngrade keUNLIKELY
. Kemungkinan tidak akan pernah turun lebih rendah dariVERY_UNLIKELY
atau melebihiVERY_LIKELY
. Dalam kasus ini, tingkat kemungkinannya tetap sama. Misalnya, jika kemungkinan dasarnya adalahVERY_LIKELY
danrelativeLikelihood
adalah 1, kemungkinan akhir tetapVERY_LIKELY
.
Contoh frasa pengaktif: Mencocokkan nomor rekam medis
Misalnya Anda ingin mendeteksi infoType kustom seperti nomor rekam medis (MRN) dalam bentuk "###-#-#####". Selain itu, Anda ingin Perlindungan Data Sensitif untuk meningkatkan kemungkinan kecocokan dari setiap temuan yang mengikuti frasa pengaktif "MRN".
Contoh nilai:
- 123-4-56789 akan cocok sebagai
POSSIBLE
. - MRN 123-4-56789 akan cocok dengan
VERY_LIKELY
.
Contoh JSON dan cuplikan kode berikut menunjukkan cara mengonfigurasi aturan frasa pengaktif. Contoh ini menggunakan pendeteksi ekspresi reguler kustom.
Dalam contoh ini, perhatikan hal-hal berikut:
- Permintaan tersebut menentukan infoType kustom
C_MRN
, yang merupakan detektor untuk string apa pun yang cocok dengan ekspresi reguler[0-9]{3}-[0-9]{1}-[0-9]{5}
. - Ekspresi reguler
(?i)(mrn|medical)(?-i)
menentukan frasa pengaktif. Penelusuran Perlindungan Data Sensitif untuk frasa pengaktif ini dalam rentang karakter yang ditentukan dalam kolomproximity
. - Untuk setiap temuan
C_MRN
yang memiliki frasa pengaktif dalam kumpulanproximity
, Perlindungan Data Sensitif menetapkan tingkat kemungkinan keVERY_LIKELY
.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Lihat panduan memulai JSON untuk mengetahui informasi lebih lanjut tentang penggunaan DLP API dengan JSON.
Metode HTTP dan URL:
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/content:inspect
Ganti PROJECT_ID
dengan project ID.
Input JSON:
{
"item":{
"value":"Patient's MRN 444-5-22222 and just a number 333-2-33333"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[0-9]{3}-[0-9]{1}-[0-9]{5}"
},
"likelihood":"POSSIBLE",
}
],
"ruleSet":[
{
"infoTypes": [{"name" : "C_MRN"}],
"rules":[
{
"hotwordRule":{
"hotwordRegex":{
"pattern":"(?i)(mrn|medical)(?-i)"
},
"likelihoodAdjustment":{
"fixedLikelihood":"VERY_LIKELY"
},
"proximity":{
"windowBefore":10
}
}
}
]
}
]
}
}
Output JSON (disingkat):
{ "result": { "findings": [ { "infoType": { "name": "C_MRN" }, "likelihood": "VERY_LIKELY", "location": { "byteRange": { "start": "14", "end": "25" }, "codepointRange": { ... } } }, { "infoType": { "name": "C_MRN" }, "likelihood": "POSSIBLE", "byteRange": { "start": "44", "end": "55" }, "codepointRange": { ... } } } ] } }
Output menunjukkan bahwa Perlindungan Data Sensitif mengidentifikasi nomor rekam medis dengan benar menggunakan detektor infoType kustom C_MRN
.
Lebih lanjut, karena konteksnya cocok
dalam aturan frasa pengaktif, Perlindungan Data Sensitif menetapkan hasil pertama—yang
memiliki MRN dalam proximity
yang ditetapkan—kemungkinan VERY_LIKELY
, seperti yang dikonfigurasi. Temuan kedua
tidak memiliki konteks, sehingga likelihood
tetap berada di POSSIBLE
.
Contoh frasa pengaktif: Menetapkan kemungkinan kecocokan untuk kolom tabel
Contoh ini menunjukkan cara menetapkan kemungkinan kecocokan di seluruh kolom data. Pendekatan ini berguna, misalnya, jika Anda ingin mengecualikan kolom data dari hasil pemeriksaan.
Perhatikan tabel berikut. Satu kolom berisi nomor Jaminan Sosial (SSN), dan kolom lainnya berisi SSN sungguhan.
Nomor Jaminan Sosial Palsu | Nomor Jaminan Sosial Asli |
---|---|
111-11-1111 | 222-22-2222 |
Untuk meminimalkan derau dalam hasil pemeriksaan, Anda dapat mengecualikan temuan di
kolom Fake Social Security Number
. Tetapkan tingkat kemungkinan rendah untuk kolom ini. Kemudian, konfigurasi permintaan yang cocok dengan tingkat kemungkinan tersebut
akan dikecualikan dari hasil.
Dalam contoh ini, perhatikan hal-hal berikut:
- Aturan frasa pengaktif diterapkan ke infoType
US_SOCIAL_SECURITY_NUMBER
. - Ekspresi reguler frasa pengaktif
(Fake Social Security Number)
berisi nama kolom yang memiliki nilai placeholder. - Properti
windowBefore
disetel ke 1, yang berarti frasa pengaktif berada di header kolom, dan temuannya harus berada di kolom. - Untuk setiap temuan
US_SOCIAL_SECURITY_NUMBER
dalam kolom ini, Perlindungan Data Sensitif menetapkan tingkat kemungkinan keVERY_UNLIKELY
. - Properti
minLikelihood
disetel kePOSSIBLE
, yang berarti bahwa setiap temuan yang memiliki tingkat kemungkinan lebih rendah dariPOSSIBLE
akan dikecualikan dari hasil pemeriksaan.
Lihat panduan memulai JSON untuk mengetahui informasi lebih lanjut tentang penggunaan DLP API dengan JSON.
Metode HTTP dan URL:
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/content:inspect
Ganti PROJECT_ID
dengan project ID.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Input JSON:{
"item": {
"table": {
"headers": [
{
"name": "Fake Social Security Number"
},
{
"name": "Real Social Security Number"
}
],
"rows": [
{
"values": [
{
"stringValue": "111-11-1111"
},
{
"stringValue": "222-22-2222"
}
]
}
]
}
},
"inspectConfig": {
"infoTypes": [
{
"name": "US_SOCIAL_SECURITY_NUMBER"
}
],
"includeQuote": true,
"ruleSet": [
{
"infoTypes": [
{
"name": "US_SOCIAL_SECURITY_NUMBER"
}
],
"rules": [
{
"hotwordRule": {
"hotwordRegex": {
"pattern": "(Fake Social Security Number)"
},
"likelihoodAdjustment": {
"fixedLikelihood": "VERY_UNLIKELY"
},
"proximity": {
"windowBefore": 1
}
}
}
]
}
],
"minLikelihood": "POSSIBLE"
}
}
Output JSON:
{ "result": { "findings": [ { "quote": "222-22-2222", "infoType": { "name": "US_SOCIAL_SECURITY_NUMBER" }, "likelihood": "VERY_LIKELY", "location": { "byteRange": { "end": "11" }, "codepointRange": { "end": "11" }, "contentLocations": [ { "recordLocation": { "fieldId": { "name": "Real Social Security Number" }, "tableLocation": {} } } ] }, "createTime": "TIMESTAMP", "findingId": "TIMESTAMP" } ] } }
Nilai 111-11-1111, yang berada di kolom Fake Social Security Number
, cocok dengan aturan frasa pengaktif, sehingga Perlindungan Data Sensitif ditetapkan ke
tingkat kemungkinan VERY_UNLIKELY
. Level ini lebih rendah dari kemungkinan
minimum yang ditetapkan dalam konfigurasi pemeriksaan (POSSIBLE
), sehingga temuan ini
dikecualikan dari hasil pemeriksaan.
Anda dapat bereksperimen dengan contoh ini dengan menghapus kumpulan aturan. Perhatikan bahwa Perlindungan Data Sensitif menyertakan 111-11-1111 dalam hasil.