Detektor infoType kustom ekspresi reguler (regex) memungkinkan Anda membuat
pendeteksi yang memungkinkan Perlindungan Data Sensitif mendeteksi kecocokan berdasarkan
pola ekspresi reguler. Misalnya, Anda memiliki nomor rekam medis dalam format ###-#-#####
. Anda dapat menentukan pola ekspresi reguler seperti berikut:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Perlindungan Data Sensitif selanjutnya akan mencocokkan item seperti berikut:
012-4-56789
Anatomi detektor infoType kustom ekspresi reguler
Seperti yang dirangkum dalam Ringkasan API, untuk membuat detektor infoType ekspresi reguler kustom, tentukan objek CustomInfoType
yang berisi hal berikut:
- Nama yang ingin Anda berikan ke detektor infoType kustom, dalam objek
InfoType
. - Nilai
Likelihood
opsional. Jika Anda menghilangkan kolom ini, pencocokan ekspresi reguler akan menampilkan kemungkinan defaultVERY_LIKELY
. Jika Anda melihat detektor infoType kustom ekspresi reguler yang menampilkan terlalu banyak positif palsu, coba kurangi kemungkinan dasar dan gunakan aturan deteksi untuk meningkatkan kemungkinan penggunaan informasi kontekstual. Untuk mempelajari lebih lanjut, lihat Menyesuaikan kemungkinan temuan. - Aturan frasa pengaktif atau
DetectionRule
opsional. Aturan ini menyesuaikan kemungkinan temuan dalam jarak tertentu dari frasa pengaktif yang ditentukan. Pelajari aturan frasa pengaktif lebih lanjut di bagian Menyesuaikan kemungkinan temuan. Nilai
SensitivityScore
opsional. Jika Anda menghapus kolom ini, kecocokan dengan ekspresi reguler akan menampilkan tingkat sensitivitas defaultHIGH
.Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Perlindungan Data Sensitif menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.
Objek
Regex
yang terdiri dari satu pola yang menentukan ekspresi reguler.
Sebagai objek JSON, detektor infoType kustom ekspresi reguler yang menyertakan semua komponen opsional akan terlihat seperti ini:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Contoh ekspresi reguler: Mencocokkan nomor rekam medis
Cuplikan dan kode JSON berikut dalam beberapa bahasa di bawah menampilkan detektor infoType kustom ekspresi reguler yang menginstruksikan Perlindungan Data Sensitif untuk mencocokkan nomor rekam medis (MRN) dalam teks input "Patient's MRN 444-5-22222", dan menetapkan setiap kecocokan dengan kemungkinan POSSIBLE
.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk mengautentikasi Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Lihat panduan memulai JSON untuk mengetahui informasi lebih lanjut tentang penggunaan DLP API dengan JSON.
Input JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Output JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
Output-nya menunjukkan bahwa, menggunakan detektor infoType kustom yang kami beri nama C_MRN
dan ekspresi reguler khususnya, Perlindungan Data Sensitif telah mengidentifikasi nomor rekam medis dengan benar dan menetapkan kepastian POSSIBLE
, seperti yang kami tentukan.
Menyesuaikan kemungkinan kecocokan akan dibuat berdasarkan contoh ini untuk menyertakan kata konteks.