Pendeteksi infoType kustom

Perlindungan Data Sensitif berisi banyak detektor infoType bawaan, tetapi Anda juga dapat membuat sendiri. Anda dapat menyesuaikan perilaku deteksi dengan menentukan pendeteksi infoType kustom Anda sendiri, sehingga Perlindungan Data Sensitif akan memeriksa atau melakukan de-identifikasi data sensitif yang cocok dengan pola yang Anda tentukan. Berikut adalah jenis pendeteksi infoType kustom:

  • Pendeteksi kamus kustom reguler adalah daftar kata dan frasa sederhana yang cocok dengan Sensitive Data Protection. Gunakan pendeteksi kamus kustom reguler jika Anda memiliki maksimal beberapa ratus ribu kata.
  • Detektor kamus kustom besar dibuat oleh Sensitive Data Protection menggunakan daftar kata atau frasa dalam jumlah besar yang disimpan di Cloud Storage atau BigQuery. Gunakan detektor kamus kustom besar saat Anda memiliki daftar kata atau frasa dalam jumlah besar—hingga puluhan juta.
  • Pendeteksi ekspresi reguler (regex) memungkinkan Perlindungan Data Sensitif untuk mendeteksi kecocokan berdasarkan pola ekspresi reguler.
  • Detektor infoType pengganti mendeteksi output dari transformasi de-identifikasi Perlindungan Data Sensitif CryptoReplaceFfxFpeConfig. Pendeteksi infoType kustom ini hanya digunakan dengan metode content:reidentify untuk membalikkan de-identifikasi menggunakan enkripsi yang mempertahankan format (FPE) dalam mode FFX. Oleh karena itu, pengganti tidak dijelaskan secara ekstensif dalam topik ini. Untuk mengetahui informasi selengkapnya tentang cara dan waktu menggunakan pendeteksi infoType kustom pengganti, lihat Pseudonimisasi.

Selain itu, Perlindungan Data Sensitif menyertakan konsep aturan pemeriksaan, yang memungkinkan Anda menyesuaikan hasil pemindaian menggunakan hal berikut:

  • Aturan pengecualian memungkinkan Anda mengecualikan temuan palsu atau yang tidak diinginkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.
  • Aturan frasa pengaktif memungkinkan Anda meningkatkan kuantitas atau akurasi temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.

Untuk mempelajari detektor infoType kustom lebih lanjut, lihat halaman konsep InfoTypes dan detektor infoType. Untuk beberapa contoh yang dapat Anda gunakan atau ubah sesuai keinginan, lihat Contoh detector infoType kustom. Bagian lainnya dalam topik ini menjelaskan cara menggunakan Perlindungan Data Sensitif untuk membuat detektor infoType kustom Anda sendiri.

Tempat menggunakan pendeteksi infoType kustom

Pendeteksi infoType kustom ditentukan dalam objek CustomInfoType. Anda menentukan CustomInfoType dalam objek InspectConfig saat mengonfigurasi hal berikut:

Ringkasan API

Objek CustomInfoType memungkinkan Anda membuat pendeteksi infoType kustom untuk konten baru atau menyetel hasil yang ditampilkan oleh pendeteksi infoType standar.

Objek CustomInfoType terdiri dari kolom berikut, yang ditetapkan seperti yang dijelaskan:

  • "infotype": Nama pendeteksi infoType kustom, yang terdapat dalam objek InfoType.
  • "likelihood": Nilai Likelihood default yang akan ditampilkan untuk detektor infoType kustom ini. Anda dapat menentukan nilai Likelihood alternatif di "detectionRules" yang akan menggantikan Likelihood dasar ini jika temuan memenuhi kriteria yang ditentukan oleh aturan. Jika Anda tidak menyertakan kolom "likelihood", pendeteksi infoType kustom akan ditetapkan secara default ke VERY_LIKELY. Untuk informasi selengkapnya tentang kemungkinan, lihat halaman konsep Kemungkinan.
  • "detectionRules": Kumpulan objek DetectionRule yang juga akan diterapkan ke semua temuan dari detector infoType kustom ini. Di sinilah Anda menentukan aturan kata kunci panas, sebagai objek HotwordRule. Aturan diterapkan sesuai urutan yang ditentukan. Kolom ini tidak berlaku untuk objek SurrogateType.
  • "sensitivityScore": Nilai SensitivityScore yang akan ditampilkan untuk penganalisis infoType kustom ini. Jika Anda tidak menyertakan kolom "sensitivityScore", pendeteksi infoType kustom akan ditetapkan secara default ke VERY_LIKELY.

    Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Perlindungan Data Sensitif menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.

  • Salah satu kolom berikut, bergantung pada jenis detector infoType kustom yang Anda buat:

    • "dictionary": Objek Dictionary, yang berisi daftar kata atau frasa yang akan ditelusuri.
    • "regex": Objek Regex, yang berisi satu pola yang menentukan ekspresi reguler.
    • "surrogateType": Objek SurrogateType, jika ada, menunjukkan bahwa detektor infoType kustom adalah surogat. Untuk informasi selengkapnya tentang cara menggunakan detektor infoType kustom pengganti, lihat Pseudonimisasi.
    • "storedType": Referensi ke objek StoredInfoType yang ada. Kolom ini wajib diisi saat membuat pendeteksi kamus kustom yang besar. Meskipun Anda dapat membuat pendeteksi kamus reguler atau pendeteksi ekspresi reguler dengan menentukan kolom ini, lebih mudah untuk membuatnya dengan menentukan kolom dictionary atau kolom regex masing-masing.

Langkah berikutnya

Pelajari lebih lanjut cara membuat infoTypes kustom dari topik berikut: