Detektor infoType kustom ekspresi reguler (regex) memungkinkan Anda membuat detektor sendiri yang memungkinkan Sensitive Data Protection mendeteksi kecocokan berdasarkan pola regex. Misalnya, Anda memiliki nomor rekam medis dalam
bentuk ###-#-#####
. Anda dapat menentukan pola regex seperti berikut:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Kemudian, Perlindungan Data Sensitif akan mencocokkan item seperti berikut:
012-4-56789
Anatomi pendeteksi infoType kustom ekspresi reguler
Seperti yang diringkas dalam
Ringkasan API, untuk membuat
detektor infoType regex kustom, Anda menentukan objek
CustomInfoType
yang berisi hal berikut:
- Nama yang ingin Anda berikan ke detektor infoType kustom, dalam objek
InfoType
. - Nilai
Likelihood
opsional. Jika Anda menghapus kolom ini, kecocokan regex akan menampilkan kemungkinan defaultVERY_LIKELY
. Jika Anda melihat detektor infoType kustom regex menampilkan terlalu banyak positif palsu, coba kurangi kemungkinan dasar dan gunakan aturan deteksi untuk meningkatkan kemungkinan menggunakan informasi kontekstual. Untuk mempelajari lebih lanjut, lihat Menyesuaikan kemungkinan temuan. - Opsional
DetectionRule
s, atau aturan frasa pengaktif. Aturan ini menyesuaikan kemungkinan temuan dalam kedekatan tertentu dari hotword yang ditentukan. Pelajari lebih lanjut aturan frasa pengaktif di bagian Menyesuaikan kemungkinan penemuan. Nilai
SensitivityScore
opsional. Jika Anda menghapus kolom ini, kecocokan dengan ekspresi reguler akan menampilkan tingkat sensitivitas defaultHIGH
.Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Sensitive Data Protection menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.
Objek
Regex
yang terdiri dari satu pola yang menentukan ekspresi reguler.
Sebagai objek JSON, detektor infoType kustom regex yang menyertakan semua komponen opsional akan terlihat seperti ini:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Contoh ekspresi reguler: Mencocokkan nomor rekam medis
Cuplikan JSON dan kode berikut dalam beberapa bahasa di bawah menunjukkan
detektor infoType kustom ekspresi reguler yang menginstruksikan
Sensitive Data Protection untuk mencocokkan nomor rekam medis
(MRN) dalam teks input "MRN pasien 444-5-22222", dan menetapkan
kemungkinan POSSIBLE
untuk setiap kecocokan.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Sensitive Data Protection, lihat library klien Sensitive Data Protection.
Untuk melakukan autentikasi ke Sensitive Data Protection, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Sensitive Data Protection, lihat library klien Sensitive Data Protection.
Untuk melakukan autentikasi ke Sensitive Data Protection, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Sensitive Data Protection, lihat library klien Sensitive Data Protection.
Untuk melakukan autentikasi ke Sensitive Data Protection, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Sensitive Data Protection, lihat library klien Sensitive Data Protection.
Untuk melakukan autentikasi ke Sensitive Data Protection, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Sensitive Data Protection, lihat library klien Sensitive Data Protection.
Untuk melakukan autentikasi ke Sensitive Data Protection, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Sensitive Data Protection, lihat library klien Sensitive Data Protection.
Untuk melakukan autentikasi ke Sensitive Data Protection, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Lihat mulai cepat JSON untuk mengetahui informasi selengkapnya tentang penggunaan DLP API dengan JSON.
Input JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Output JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
Output menunjukkan bahwa, dengan menggunakan detektor infoType kustom yang kami beri nama
C_MRN
dan ekspresi reguler kustomnya, Sensitive Data Protection telah dengan benar
mengidentifikasi nomor rekam medis dan menetapkan kepastian POSSIBLE
kepadanya,
seperti yang kami tentukan.
Menyesuaikan kemungkinan kecocokan dibuat berdasarkan contoh ini untuk menyertakan kata konteks.