Pendeteksi infoType kustom

Perlindungan Data Sensitif berisi banyak deteksi infoType bawaan, tetapi Anda juga dapat membuatnya sendiri. Anda dapat menyesuaikan perilaku deteksi dengan menentukan pendeteksi infoType kustom Anda sendiri, sehingga Perlindungan Data Sensitif akan memeriksa atau melakukan de-identifikasi data sensitif yang cocok dengan pola yang Anda tentukan. Berikut adalah jenis pendeteksi infoType kustom:

  • Pendeteksi kamus kustom biasa adalah daftar kata dan frasa sederhana yang cocok dengan Perlindungan Data Sensitif. Gunakan pendeteksi kamus kustom reguler saat Anda memiliki maksimal beberapa ratus ribu kata.
  • Pendeteksi kamus kustom berukuran besar dibuat oleh Perlindungan Data Sensitif menggunakan daftar besar kata atau frasa yang disimpan di Cloud Storage atau BigQuery. Gunakan pendeteksi kamus kustom yang besar jika Anda memiliki banyak kata atau frasa—hingga puluhan juta.
  • Pendeteksi ekspresi reguler (regex) memungkinkan Perlindungan Data Sensitif untuk mendeteksi kecocokan berdasarkan pola ekspresi reguler.
  • Pendeteksi infoType surrogate mendeteksi output dari transformasi de-identifikasi Perlindungan Data Sensitif CryptoReplaceFfxFpeConfig. Detektor infoType kustom ini hanya digunakan dengan metode content:reidentify untuk membalikkan de-identifikasi menggunakan enkripsi yang menjaga format (FPE) dalam mode FFX. Karena alasan ini, pengganti tidak dijelaskan secara ekstensif dalam topik ini. Untuk informasi selengkapnya tentang bagaimana dan kapan harus menggunakan detektor infoType kustom surrogate, lihat Pseudonimisasi.

Selain itu, Perlindungan Data Sensitif mencakup konsep aturan pemeriksaan, yang memungkinkan Anda menyempurnakan hasil pemindaian menggunakan hal berikut:

  • Aturan pengecualian memungkinkan Anda mengecualikan temuan yang salah atau tidak diinginkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.
  • Aturan frasa pengaktif memungkinkan Anda meningkatkan kuantitas atau akurasi temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.

Untuk mempelajari pendeteksi infoType kustom lebih lanjut, lihat halaman konsep InfoTypes dan infoType detectors. Untuk beberapa contoh yang dapat Anda gunakan atau ubah sesuai kebutuhan, lihat Contoh pendeteksi infoType kustom. Bagian selanjutnya dari topik ini menjelaskan cara menggunakan Perlindungan Data Sensitif untuk membuat detektor infoType kustom Anda sendiri.

Tempat menggunakan pendeteksi infoType kustom

Detektor infoType kustom ditentukan dalam objek CustomInfoType. Anda menentukan CustomInfoType dalam objek InspectConfig saat mengonfigurasi hal berikut:

Ringkasan API

Objek CustomInfoType memungkinkan Anda membuat detektor infoType kustom untuk konten baru atau menyesuaikan hasil yang ditampilkan oleh detektor infoType yang ditentukan sebelumnya.

Objek CustomInfoType terdiri dari kolom berikut, yang ditetapkan seperti yang dijelaskan:

  • "infotype": Nama detektor infoType kustom, yang terdapat dalam objek InfoType.
  • "likelihood": Nilai Likelihood default yang akan ditampilkan untuk detektor infoType kustom ini. Anda dapat menentukan nilai Likelihood alternatif di "detectionRules" yang akan menggantikan Likelihood dasar ini jika temuan tersebut memenuhi kriteria yang ditentukan oleh aturan. Jika Anda tidak menyertakan kolom "likelihood", detektor infoType kustom akan ditetapkan secara default ke VERY_LIKELY. Untuk informasi selengkapnya tentang kemungkinan, lihat halaman konsep Likelihood.
  • "detectionRules": Kumpulan objek DetectionRule yang akan diterapkan tambahan ke semua temuan pendeteksi infoType kustom ini. Di sinilah Anda menentukan aturan frasa pengaktif, sebagai objek HotwordRule. Aturan diterapkan sesuai urutan penetapannya. Kolom ini tidak berlaku untuk objek SurrogateType.
  • "sensitivityScore": Nilai SensitivityScore yang akan ditampilkan untuk detektor infoType kustom ini. Jika Anda tidak menyertakan kolom "sensitivityScore", detektor infoType kustom akan ditetapkan secara default ke VERY_LIKELY.

    Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Perlindungan Data Sensitif menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.

  • Salah satu kolom berikut, bergantung pada jenis pendeteksi infoType kustom yang Anda buat:

    • "dictionary": Objek Dictionary, yang berisi daftar kata atau frasa yang akan ditelusuri.
    • "regex": Objek Regex, yang berisi satu pola yang menentukan ekspresi reguler.
    • "surrogateType": Objek SurrogateType, jika ada, menunjukkan bahwa detektor infoType kustom adalah surrogate. Untuk informasi selengkapnya tentang cara menggunakan detektor infoType kustom surrogate, lihat Pseudonimisasi.
    • "storedType": Referensi ke objek StoredInfoType yang ada. Kolom ini wajib diisi saat membuat pendeteksi kamus kustom berukuran besar. Meskipun Anda dapat membuat pendeteksi kamus reguler atau pendeteksi ekspresi reguler dengan menentukan kolom ini, akan lebih mudah untuk membuatnya dengan menentukan kolom dictionary atau kolom regex.

Langkah berikutnya

Pelajari lebih lanjut cara membuat infoType kustom dari topik berikut: