Detektor infoType kustom ekspresi reguler (regex) memungkinkan Anda membuat
detektor sendiri yang memungkinkan Perlindungan Data Sensitif mendeteksi kecocokan berdasarkan
pola ekspresi reguler. Misalnya, Anda memiliki nomor rekam medis dalam
bentuk ###-#-#####
. Anda dapat menentukan pola ekspresi reguler seperti berikut:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Perlindungan Data Sensitif kemudian akan mencocokkan item seperti berikut:
012-4-56789
Anatomi pendeteksi infoType kustom ekspresi reguler
Seperti yang diringkas dalam
Ringkasan API, untuk membuat
detektor infoType ekspresi reguler kustom, Anda menentukan objek
CustomInfoType
yang berisi hal berikut:
- Nama yang ingin Anda berikan ke pendeteksi infoType kustom, dalam objek
InfoType
. - Nilai
Likelihood
opsional. Jika Anda menghapus kolom ini, kecocokan ekspresi reguler akan menampilkan kemungkinan defaultVERY_LIKELY
. Jika Anda melihat bahwa pendeteksi infoType kustom ekspresi reguler menampilkan terlalu banyak positif palsu, coba kurangi kemungkinan dasar dan gunakan aturan deteksi untuk meningkatkan kemungkinan menggunakan informasi kontekstual. Untuk mempelajari lebih lanjut, lihat Menyesuaikan kemungkinan penemuan. DetectionRule
opsional, atau aturan frasa pengaktif. Aturan ini menyesuaikan kemungkinan temuan dalam jarak tertentu dari kata kunci yang ditentukan. Pelajari aturan frasa pengaktif lebih lanjut di Menyesuaikan kemungkinan penemuan.Nilai
SensitivityScore
opsional. Jika Anda menghapus kolom ini, kecocokan dengan ekspresi reguler akan menampilkan tingkat sensitivitas defaultHIGH
.Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Perlindungan Data Sensitif menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.
Objek
Regex
yang terdiri dari satu pola yang menentukan ekspresi reguler.
Sebagai objek JSON, detektor infoType kustom ekspresi reguler yang menyertakan semua komponen opsional akan terlihat seperti ini:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Contoh ekspresi reguler: Mencocokkan nomor rekam medis
Cuplikan dan kode JSON berikut dalam beberapa bahasa di bawah menunjukkan
detektor infoType kustom ekspresi reguler yang menginstruksikan
Perlindungan Data Sensitif untuk mencocokkan nomor rekam medis
(MRN) dalam teks input "MRN Pasien 444-5-22222", dan menetapkan kemungkinan POSSIBLE
untuk setiap kecocokan.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Lihat panduan memulai JSON untuk mengetahui informasi selengkapnya tentang penggunaan DLP API dengan JSON.
Input JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Output JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
Output menunjukkan bahwa, dengan menggunakan detektor infoType kustom yang diberi nama
C_MRN
dan ekspresi reguler kustomnya, Perlindungan Data Sensitif telah
mengidentifikasi nomor rekam medis dengan benar dan menetapkan kepastian POSSIBLE
,
seperti yang kita tentukan.
Menyesuaikan kemungkinan pencocokan didasarkan pada contoh ini untuk menyertakan kata konteks.