Perlindungan Data Sensitif menggunakan jenis informasi—atau infoType—untuk menentukan apa yang dipindai. InfoType adalah jenis data sensitif, seperti nama, alamat email, nomor telepon, nomor identifikasi, nomor kartu kredit, dan sebagainya. Pendeteksi infoType adalah mekanisme deteksi yang sesuai yang cocok dengan kriteria pencocokan infoType.
Praktik terbaik untuk memilih infoTypes
Memahami data Anda adalah salah satu langkah penting pertama dalam melindunginya. Sebagai praktik terbaik, Anda harus mengumpulkan, menyimpan, dan memproses hanya informasi yang diperlukan bisnis Anda. Dengan mengidentifikasi data yang Anda tangani, Anda dapat membuat keputusan yang tepat untuk bisnis, pengguna, serta postur keamanan dan privasi data Anda.
Beberapa kasus penggunaan bisnis Anda mungkin memerlukan informasi sensitif tertentu, dan kasus lainnya mungkin tidak. Tidak ada satu solusi yang mendukung semua kasus penggunaan. Oleh karena itu, Perlindungan Data Sensitif menawarkan kontrol yang fleksibel atas jenis data yang akan dipindai. Jika menggunakan infoTypes untuk de-identifikasi atau penyamarkan, Anda juga memiliki kontrol atas kapan dan bagaimana data diubah.
Panduan umum
Pertimbangkan panduan umum berikut saat memilih infoTypes.
Informasi sensitif yang tidak perlu Anda kumpulkan
Setiap layanan di bisnis Anda hanya boleh mengumpulkan data yang diperlukan
layanan. Misalnya, layanan tertentu dalam bisnis Anda tidak perlu mengumpulkan
informasi keuangan. Untuk layanan tersebut, pertimbangkan untuk mengaktifkan detektor infoType
seperti CREDIT_CARD_NUMBER
, FINANCIAL_ACCOUNT_NUMBER
, dan infoType lainnya dalam
kategori industri
FINANCE
.
Informasi yang perlu Anda kumpulkan, tetapi tidak ingin dibagikan secara luas kepada tim
Mungkin ada kasus penggunaan yang valid untuk mengumpulkan informasi pribadi, tetapi Anda
tidak boleh membagikannya secara luas kepada tim. Misalnya, pelanggan yang mengajukan
tiket dukungan dapat memberikan informasi kontak kepada Anda, sehingga Anda dapat menghubunginya
untuk menyelesaikan masalah apa pun. Anda tidak ingin semua anggota tim yang melihat tiket
melihat informasi identitas pribadi (PII). Pertimbangkan untuk mengaktifkan detector infoType
seperti PHONE_NUMBER
, EMAIL_ADDRESS
, dan infoType lainnya dalam kategori
jenis PII
.
Kategori data sensitif yang diatur oleh peraturan industri, privasi data, atau wilayah hukum
Jenis informasi tertentu dianggap sensitif karena cara informasi tersebut diterbitkan atau tujuan penggunaannya. Dalam kasus lain, informasi kontekstual dan demografis dianggap sebagai kategori yang dilindungi. Jenis informasi ini mungkin memiliki batasan tambahan terkait cara pengumpulan, penggunaan, dan pengelolaannya. Pertimbangkan untuk mengaktifkan pendeteksi infoType dalam kategori berikut:
- Kategori jenis
SPII
,GOVERNMENT_ID
, danDEMOGRAPHIC
- Kategori
industri
HEALTH
Memilih antara infoType yang serupa
Pertimbangkan hal berikut saat memilih antara pendeteksi infoType yang serupa.
Paspor
Jika Anda tidak perlu memindai ID paspor dari negara tertentu,
pilih detektor umum: PASSPORT
.
Detektor paspor khusus negara tertentu, seperti UK_PASSPORT
, tersedia. Namun, beberapa detektor paspor khusus negara hanya dapat mengidentifikasi
paspor dengan format tertentu atau dengan adanya petunjuk kontekstual.
Nama orang
Saat memindai nama orang, gunakan PERSON_NAME
untuk sebagian besar
kasus penggunaan, bukan FIRST_NAME
atau LAST_NAME
.
PERSON_NAME
adalah pendeteksi untuk nama orang. Nama ini mencakup nama satu kata
dan nama lengkap. Pendeteksi ini mencoba mendeteksi, misalnya, nama seperti
Jane, Jane Smith, dan Jane Marie Smith menggunakan berbagai teknologi,
termasuk pemahaman bahasa alami. FIRST_NAME
dan LAST_NAME
adalah
subkumpulan dari pendeteksi ini yang mencoba mengidentifikasi bagian-bagian nama. Temuan
dari pendeteksi ini selalu merupakan subset dari temuan dari PERSON_NAME
.
Tanggal dan waktu
Jika Anda tidak perlu memindai semua tanggal, pertimbangkan untuk menggunakan detektor tanggal yang ditargetkan
seperti DATE_OF_BIRTH
. Pendeteksi ini mencoba mengidentifikasi konteks yang menunjukkan bahwa
tanggal terkait dengan waktu kelahiran seseorang.
Detektor DATE
mencoba menemukan semua tanggal, terlepas dari konteksnya. Fungsi ini juga
menandai tanggal relatif, seperti hari ini atau kemarin. Demikian pula, TIME
mencoba
menemukan semua stempel waktu.
Lokasi
Jika Anda tidak perlu memindai semua lokasi, pertimbangkan untuk menggunakan STREET_ADDRESS
,
bukan detektor LOCATION
. Detektor STREET_ADDRESS
mencoba menemukan alamat yang sepenuhnya memenuhi syarat, yang biasanya lebih akurat daripada lokasi umum dan dapat dianggap lebih sensitif.
Pendeteksi infoType LOCATION
mencoba menemukan lokasi apa pun, terlepas dari
konteksnya—misalnya, Paris atau Kanada.
Pendeteksi InfoType yang memerlukan konteks
Banyak detektor infoType memerlukan petunjuk kontekstual sebelum
mengidentifikasi kecocokan. Jika pendeteksi infoType bawaan tidak menandai item yang Anda
harapkan akan ditandai, karena tidak ada petunjuk kontekstual yang terjadi di dekat
item tersebut, sebaiknya gunakan GENERIC_ID
atau pendeteksi infoType
kustom.
Jenis informasi yang tidak memiliki definisi industri umum
Beberapa jenis informasi tidak memiliki definisi industri yang umum. Contohnya adalah nomor catatan medis, nomor akun, PIN, dan kode keamanan. Untuk jenis ini,
pertimbangkan untuk menggunakan infoType seperti GENERIC_ID
, FINANCIAL_ACCOUNT_NUMBER
, dan
MEDICAL_RECORD_NUMBER
. Pendeteksi ini menggunakan kombinasi deteksi entity
dan konteks untuk menemukan elemen yang berpotensi sensitif.
Pendeteksi infoType dengan latensi lebih tinggi
Hindari mengaktifkan detektor infoType yang tidak Anda perlukan. Meskipun hal berikut berguna dalam skenario tertentu, infoTypes ini dapat membuat permintaan berjalan jauh lebih lambat daripada permintaan yang tidak menyertakannya:
PERSON_NAME
FEMALE_NAME
MALE_NAME
FIRST_NAME
LAST_NAME
DATE_OF_BIRTH
LOCATION
STREET_ADDRESS
ORGANIZATION_NAME
Selalu tentukan pendeteksi infoType secara eksplisit. Jangan gunakan daftar infoTypes kosong.
Cara menggunakan infoTypes
Perlindungan Data Sensitif menggunakan pendeteksi infoType dalam konfigurasi untuk pemindaian guna menentukan apa yang akan diperiksa dan cara mengubah temuan. Nama InfoType juga digunakan saat menampilkan atau melaporkan hasil pemindaian.
Misalnya, jika ingin mencari alamat email dalam blok teks, Anda
akan menentukan detektor infoType EMAIL_ADDRESS
dalam konfigurasi
pemeriksaan. Jika ingin menyamarkan alamat email dari blok teks,
Anda harus menentukan EMAIL_ADDRESS
dalam konfigurasi inspeksi dan
konfigurasi de-identifikasi untuk menunjukkan cara menyamarkan atau mengubah jenis
tersebut.
Selain itu, Anda dapat menggunakan kombinasi antara pendeteksi infoType bawaan dan kustom
untuk mengecualikan sebagian alamat email dari temuan pemindaian. Pertama, buat
infoType kustom yang disebut INTERNAL_EMAIL_ADDRESS
dan konfigurasikan untuk mengecualikan
alamat email pengujian internal. Kemudian, Anda dapat menyiapkan pemindaian untuk menyertakan
temuan untuk EMAIL_ADDRESS
, tetapi menyertakan aturan pengecualian yang mengecualikan
temuan apa pun yang cocok dengan INTERNAL_EMAIL_ADDRESS
. Untuk informasi selengkapnya tentang
aturan pengecualian dan fitur lain dari detektor infoType kustom, lihat Membuat
detektor infoType kustom.
Perlindungan Data Sensitif menyediakan serangkaian detektor infoType bawaan yang Anda tentukan berdasarkan nama, yang masing-masing tercantum dalam Referensi detektor InfoType. Detektor ini menggunakan berbagai teknik untuk menemukan dan mengklasifikasikan setiap jenis. Misalnya, beberapa jenis akan memerlukan pencocokan pola, beberapa mungkin memiliki checksum matematika, beberapa memiliki batasan angka khusus, dan lainnya mungkin memiliki awalan atau konteks tertentu di sekitar temuan.
Contoh
Saat menyiapkan Perlindungan Data Sensitif untuk memindai konten, Anda menyertakan pendeteksi infoType yang akan digunakan dalam konfigurasi pemindaian.
Misalnya, contoh JSON dan kode berikut menunjukkan permintaan pemindaian sederhana ke DLP API. Perhatikan bahwa detektor PHONE_NUMBER
ditentukan di
inspectConfig
,
yang menginstruksikan Perlindungan Data Sensitif untuk memindai string yang diberikan untuk menemukan
nomor telepon.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Input JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT-ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"My phone number is (415) 555-0890"
},
"inspectConfig":{
"includeQuote":true,
"minLikelihood":"POSSIBLE",
"infoTypes":{
"name":"PHONE_NUMBER"
}
}
}
Saat Anda mengirim permintaan sebelumnya ke endpoint yang ditentukan, Perlindungan Data Sensitif akan menampilkan hal berikut:
Output JSON:
{
"result":{
"findings":[
{
"quote":"(415) 555-0890",
"infoType":{
"name":"PHONE_NUMBER"
},
"likelihood":"VERY_LIKELY",
"location":{
"byteRange":{
"start":"19",
"end":"33"
},
"codepointRange":{
"start":"19",
"end":"33"
}
},
"createTime":"2018-10-29T23:46:34.535Z"
}
]
}
}
Anda harus menentukan infoTypes tertentu yang tercantum dalam referensi dalam konfigurasi inspeksi. Jika Anda tidak menentukan infoType apa pun, Perlindungan Data Sensitif akan menggunakan daftar infoType default yang hanya ditujukan untuk tujuan pengujian. Daftar default mungkin tidak cocok untuk kasus penggunaan Anda.
Untuk mengetahui informasi selengkapnya tentang cara menggunakan detektor infoType untuk memindai konten Anda, lihat salah satu topik cara tentang memeriksa, menyamarkan, atau menghapus identitas.
Kepastian dan pengujian
Temuan dilaporkan dengan skor kepastian yang disebut kemungkinan. Skor kemungkinan menunjukkan seberapa besar kemungkinan temuan cocok dengan jenis yang sesuai. Misalnya, jenis dapat menampilkan kemungkinan yang lebih rendah jika hanya cocok dengan pola dan menampilkan kemungkinan yang lebih tinggi jika cocok dengan pola dan memiliki konteks positif di sekitarnya. Oleh karena itu, Anda mungkin melihat bahwa satu temuan dapat cocok dengan beberapa jenis dengan kemungkinan yang lebih rendah. Selain itu, temuan mungkin tidak muncul atau mungkin memiliki kepastian yang lebih rendah jika tidak cocok dengan benar, atau jika memiliki konteks negatif di sekitarnya. Misalnya, temuan mungkin tidak dilaporkan jika cocok dengan struktur untuk infoType yang ditentukan, tetapi gagal pada checksum infoType. Atau, temuan dapat cocok dengan lebih dari satu infoType, tetapi memiliki konteks yang meningkatkan salah satunya, sehingga hanya dilaporkan untuk jenis tersebut.
Jika Anda menguji berbagai detektor, Anda mungkin melihat bahwa data palsu atau sampel tidak dilaporkan karena data palsu atau sampel tersebut tidak lulus pemeriksaan yang cukup untuk dilaporkan.
Jenis pendeteksi infoType
Perlindungan Data Sensitif mencakup beberapa jenis detektor infoType, yang semuanya disertakan di sini:
- Detektor infoType bawaan disertakan dalam Perlindungan Data Sensitif. Pendeteksi ini mencakup pendeteksi untuk jenis data sensitif khusus negara atau wilayah serta jenis data yang berlaku secara global.
- Detektor infoType kustom adalah pendeteksi yang Anda buat sendiri. Ada tiga jenis pendeteksi infoType kustom:
- Detektor kamus kustom kecil adalah daftar kata sederhana yang dicocokkan dengan Perlindungan Data Sensitif. Gunakan pendeteksi kamus kustom kecil jika Anda memiliki daftar hingga beberapa puluhan ribu kata atau frasa. Detektor kamus kustom kecil lebih disukai jika Anda tidak mengantisipasi perubahan daftar kata secara signifikan.
- Detektor kamus kustom besar dibuat oleh Perlindungan Data Sensitif menggunakan daftar besar kata atau frasa yang disimpan di Cloud Storage atau BigQuery. Gunakan pendeteksi kamus kustom besar jika Anda memiliki daftar kata atau frasa yang besar—hingga puluhan juta.
- Detektor ekspresi reguler (regex) memungkinkan Perlindungan Data Sensitif mendeteksi kecocokan berdasarkan pola ekspresi reguler.
Selain itu, Perlindungan Data Sensitif mencakup konsep aturan pemeriksaan, yang memungkinkan Anda menyesuaikan hasil pemindaian menggunakan hal berikut:
- Aturan pengecualian memungkinkan Anda mengurangi jumlah temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.
- Aturan kata cepat memungkinkan Anda meningkatkan kuantitas atau mengubah nilai kemungkinan temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.
Pendeteksi infoType bawaan
Detektor infoType bawaan terintegrasi dalam Perlindungan Data Sensitif, dan
menyertakan detektor untuk jenis data sensitif khusus negara atau wilayah seperti
Numéro d'Inscription au Répertoire (NIR) Prancis (FRANCE_NIR
), nomor surat izin mengemudi
Inggris Raya (UK_DRIVERS_LICENSE_NUMBER
), dan nomor Jaminan Sosial Amerika Serikat (US_SOCIAL_SECURITY_NUMBER
). Detektor ini juga mencakup jenis data
yang berlaku secara global seperti nama orang (PERSON_NAME
), nomor telepon (PHONE_NUMBER
),
alamat email (EMAIL_ADDRESS
), dan nomor kartu kredit
(CREDIT_CARD_NUMBER
). Untuk mendeteksi konten yang sesuai dengan infoType,
Perlindungan Data Sensitif memanfaatkan berbagai teknik termasuk pencocokan
pola, checksum, machine learning, analisis konteks, dan lainnya.
Daftar pendeteksi infoType bawaan selalu diperbarui. Untuk daftar lengkap detektor infoType bawaan yang saat ini didukung, lihat Referensi detektor InfoType.
Anda juga dapat melihat daftar lengkap semua detektor infoType bawaan dengan
memanggil metode
infoTypes.list
Sensitive Data Protection.
Dukungan bahasa
infoTypes khusus negara mendukung bahasa Inggris dan bahasa negara masing-masing. Sebagian besar infoTypes global berfungsi dengan beberapa bahasa. Uji Perlindungan Data Sensitif dengan data Anda untuk memverifikasi bahwa data tersebut memenuhi persyaratan Anda.
Pendeteksi infoType kustom
Ada tiga jenis pendeteksi infoType kustom:
Selain itu, Perlindungan Data Sensitif menyertakan aturan pemeriksaan, yang memungkinkan Anda menyesuaikan hasil pemindaian dengan menambahkan hal berikut ke pendeteksi yang ada:
Pendeteksi kamus kustom kecil
Gunakan pendeteksi kamus kustom kecil (juga disebut sebagai "pendeteksi kamus kustom reguler") untuk mencocokkan daftar kata atau frasa yang singkat (hingga beberapa puluhan ribu) kata. Kamus kustom kecil dapat berfungsi sebagai pendeteksi uniknya sendiri.
Pendeteksi kamus kustom berguna saat Anda ingin memindai daftar kata atau frasa yang tidak mudah dicocokkan dengan ekspresi reguler atau pendeteksi bawaan. Misalnya, Anda ingin memindai ruang konferensi yang biasa disebut dengan nama ruang yang ditetapkan, bukan nomor ruangnya, seperti nama negara bagian atau wilayah, penanda, karakter fiksi, dan sebagainya. Anda dapat membuat detektor kamus kustom kecil yang berisi daftar nama ruangan ini. Sensitive Data Protection dapat memindai konten Anda untuk setiap nama ruangan dan menampilkan kecocokan saat menemukan salah satunya dalam konteks. Pelajari lebih lanjut cara Perlindungan Data Sensitif mencocokkan kata dan frasa dicikon bagian "Detail pencocokan dicikon" di bagian Membuat detector dicikon kustom reguler.
Untuk mengetahui detail selengkapnya tentang cara kerja pendeteksi infoType kustom kamus kecil, serta contoh penerapannya, lihat Membuat pendeteksi kamus kustom reguler.
Pendeteksi kamus kustom besar
Gunakan pendeteksi kamus kustom besar (juga disebut sebagai "pendeteksi kamus kustom tersimpan") jika Anda memiliki lebih dari beberapa kata atau frasa yang akan dipindai, atau jika daftar kata atau frasa Anda sering berubah. Pendeteksi kamus kustom besar dapat mencocokkan hingga puluhan juta kata atau frasa.
Pendeteksi kamus kustom besar dibuat secara berbeda dari pendeteksi kustom ekspresi reguler dan pendeteksi kamus kustom kecil. Setiap kamus kustom besar memiliki dua komponen:
- Daftar frasa yang Anda buat dan tentukan. Daftar disimpan sebagai file teks dalam Cloud Storage atau kolom dalam tabel BigQuery.
- File kamus yang dihasilkan, yang dibuat oleh Perlindungan Data Sensitif berdasarkan daftar frasa Anda. File kamus disimpan di Cloud Storage, dan terdiri dari salinan data frasa sumber serta filter bloom, yang membantu penelusuran dan pencocokan. Anda tidak dapat mengedit file ini secara langsung.
Setelah membuat daftar kata, lalu menggunakan Sensitive Data Protection untuk membuat kamus kustom, Anda memulai atau menjadwalkan pemindaian menggunakan pendeteksi kamus kustom besar dengan cara yang serupa seperti pendeteksi infoType lainnya.
Untuk mengetahui detail selengkapnya tentang cara kerja detektor kamus kustom yang besar, serta contoh penerapannya, lihat Membuat detektor kamus kustom yang disimpan.
Ekspresi reguler
Detektor infoType kustom ekspresi reguler (regex) memungkinkan Anda membuat
detektor infoType sendiri yang memungkinkan Perlindungan Data Sensitif mendeteksi kecocokan
berdasarkan pola ekspresi reguler. Misalnya, Anda memiliki nomor rekam medis
dalam bentuk ###-#-#####
. Anda dapat menentukan pola ekspresi reguler seperti
berikut:
[1-9]{3}-[1-9]{1}-[1-9]{5}
Perlindungan Data Sensitif kemudian akan mencocokkan item seperti ini:
123-4-56789
Anda juga dapat menentukan kemungkinan untuk ditetapkan ke setiap
pencocokan infoType kustom. Artinya, saat Sensitive Data Protection cocok dengan urutan yang Anda tentukan, fitur ini akan menetapkan kemungkinan yang telah Anda tunjukkan. Hal ini
berguna karena jika ekspresi reguler kustom Anda menentukan urutan yang cukup umum, urutan tersebut
dapat dengan mudah cocok dengan beberapa urutan acak lainnya. Anda tidak ingin
Perlindungan Data Sensitif melabeli setiap kecocokan sebagai VERY_LIKELY
. Tindakan ini akan
mengurangi keyakinan pada hasil pemindaian dan berpotensi menyebabkan informasi yang salah
dicocokkan atau dide-identifikasi.
Untuk mengetahui informasi selengkapnya tentang detektor infoType kustom ekspresi reguler, dan untuk melihat cara kerjanya, lihat Membuat detektor regex kustom.
Aturan inspeksi
Anda menggunakan aturan pemeriksaan untuk menyaring hasil yang ditampilkan oleh pendeteksi infoType yang ada—baik bawaan maupun kustom. Aturan pemeriksaan dapat berguna saat hasil yang ditampilkan Sensitive Data Protection perlu ditingkatkan dengan cara tertentu, baik dengan menambahkan ke dan mengecualikan dari detector infoType yang ada.
Dua jenis aturan inspeksi adalah:
- Aturan pengecualian
- Aturan frasa pengaktif
Untuk informasi selengkapnya tentang aturan pemeriksaan, lihat Mengubah detektor infoType untuk meningkatkan hasil pemindaian.
Aturan pengecualian
Aturan pengecualian memungkinkan Anda mengurangi jumlah atau presisi temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom. Aturan pengecualian dapat membantu Anda mengurangi derau atau temuan tidak diinginkan lainnya agar tidak ditampilkan oleh detektor infoType.
Misalnya, jika Anda memindai database untuk menemukan alamat email, Anda dapat menambahkan aturan pengecualian dalam bentuk ekspresi reguler kustom yang menginstruksikan Perlindungan Data Sensitif untuk mengecualikan temuan apa pun yang diakhiri dengan "@example.com".
Untuk mengetahui informasi selengkapnya tentang aturan pengecualian, lihat Mengubah detektor infoType untuk menyaring hasil pemindaian.
Aturan frasa pengaktif
Aturan frasa pengaktif memungkinkan Anda meningkatkan kuantitas atau akurasi temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom. Aturan kata cepat dapat membantu Anda melonggarkan aturan detektor infoType yang ada secara efektif.
Misalnya, Anda ingin memindai database medis untuk mencari nama pasien. Anda
dapat menggunakan detector infoType PERSON_NAME
bawaan
Sensitive Data Protection, tetapi hal itu akan menyebabkan Sensitive Data Protection cocok dengan semua
nama orang, bukan hanya nama pasien. Untuk memperbaikinya, Anda dapat menyertakan
aturan frasa pengaktif dalam bentuk infoType kustom ekspresi reguler yang mencari kata
"pasien" dalam kedekatan karakter tertentu dari karakter pertama
potensial kecocokan. Kemudian, Anda dapat menetapkan temuan yang cocok dengan pola ini dengan
kemungkinan "sangat mungkin", karena sesuai dengan
kriteria khusus Anda.
Untuk mengetahui informasi selengkapnya tentang aturan frasa pengaktif, lihat Mengubah detektor infoType untuk meningkatkan hasil pemindaian.
Contoh
Untuk mendapatkan gambaran yang lebih baik tentang cara infoTypes cocok dengan temuan, lihat contoh pencocokan berikut pada serangkaian angka untuk menentukan apakah angka tersebut merupakan Nomor Jaminan Sosial AS atau Nomor Pokok Wajib Pajak Orang Pribadi AS. Perlu diingat bahwa contoh ini ditujukan untuk pendeteksi infoType bawaan. Saat membuat detektor infoType kustom, Anda menentukan kriteria yang menentukan kemungkinan kecocokan pemindaian.
Contoh 1
"SSN 222-22-2222"
Melaporkan skor kemungkinan tinggi VERY_LIKELY
untuk
US_SOCIAL_SECURITY_NUMBER
karena:
- Nomor ini dalam format nomor Jaminan Sosial standar, yang meningkatkan kepastian.
- Istilah ini memiliki konteks di dekatnya ("SSN") yang meningkatkan
US_SOCIAL_SECURITY_NUMBER
.
Contoh 2
"999-99-9999"
Melaporkan skor kemungkinan rendah VERY_UNLIKELY
untuk
US_SOCIAL_SECURITY_NUMBER
karena:
- Formatnya adalah format standar, yang meningkatkan kepastian.
- Nomor ini dimulai dengan 9, yang tidak diizinkan dalam nomor Jaminan Sosial, sehingga menurunkan kepastian.
- Pertanyaan ini tidak memiliki konteks, sehingga menurunkan kepastian.
Contoh 3
"999-98-9999"
Melaporkan skor kemungkinan POSSIBLE
untuk
US_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER
dan VERY_UNLIKELY
untuk
US_SOCIAL_SECURITY_NUMBER
karena:
- Format ini memiliki format standar untuk
US_SOCIAL_SECURITY_NUMBER
danUS_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER
. - Kode ini dimulai dengan 9 dan memiliki pemeriksaan digit lain, yang meningkatkan kepastian untuk
US_INDIVIDUAL_TAXPAYER_IDENTIFICATION_NUMBER
. - Pertanyaan ini tidak memiliki konteks, sehingga menurunkan kepastian untuk keduanya.
Langkah selanjutnya
Tim Perlindungan Data Sensitif merilis grup dan pendeteksi infoType baru secara berkala. Untuk mempelajari cara mendapatkan daftar infoType bawaan terbaru, lihat Mencantumkan pendeteksi infoType bawaan.