Topik ini menjelaskan cara membuat dan mem-build ulang kamus kustom yang besar. Halaman ini juga membahas beberapa skenario error.
Kapan harus memilih kamus kustom besar daripada kamus kustom biasa
Pendeteksi kamus kustom reguler sudah memadai jika Anda memiliki puluhan ribu kata atau frasa sensitif yang ingin dipindai di konten Anda. Jika Anda memiliki lebih banyak istilah atau jika daftar istilah sering berubah, sebaiknya buat kamus kustom besar, yang dapat mendukung puluhan juta istilah.
Perbedaan antara kamus kustom besar dengan infoType kustom lainnya
Kamus kustom besar berbeda dengan infoType kustom lainnya karena setiap kamus kustom besar memiliki dua komponen:
- Daftar frasa yang Anda buat dan tentukan. Daftar disimpan sebagai file teks dalam Cloud Storage atau kolom dalam tabel BigQuery.
- File kamus, yang dibuat dan disimpan oleh Perlindungan Data Sensitif di Cloud Storage. File kamus terdiri dari salinan daftar istilah Anda ditambah filter bloom, yang membantu penelusuran dan pencocokan.
Membuat kamus kustom besar
Bagian ini menjelaskan cara membuat, mengedit, dan mem-build ulang kamus kustom yang besar.
Membuat daftar istilah
Buat daftar yang berisi semua kata dan frasa yang ingin ditelusuri oleh pendeteksi infoType baru. Lakukan salah satu hal berikut:
- Tempatkan file teks dengan setiap kata atau frasa di barisnya sendiri ke dalam bucket Cloud Storage.
- Tetapkan satu kolom tabel BigQuery sebagai penampung untuk kata dan frasa. Berikan baris sendiri untuk setiap entri di kolom. Anda dapat menggunakan tabel BigQuery yang ada, selama semua kata dan frasa kamus berada dalam satu kolom.
Anda dapat menyusun daftar istilah yang terlalu besar untuk diproses oleh Perlindungan Data Sensitif. Jika Anda melihat pesan error, lihat Memecahkan masalah error nanti di topik ini.
Membuat infoType tersimpan
Setelah Anda membuat daftar istilah, gunakan Perlindungan Data Sensitif untuk membuat kamus:
Konsol
Di bucket Cloud Storage, buat folder baru tempat Perlindungan Data Sensitif akan menyimpan kamus yang dihasilkan.
Perlindungan Data Sensitif membuat folder yang berisi file kamus di lokasi yang Anda tentukan.
Di konsol Google Cloud, buka halaman Create infoType.
Untuk Jenis, pilih Kamus kustom besar.
Untuk ID InfoType, masukkan ID untuk infoType yang tersimpan.
Anda akan menggunakan ID ini saat mengonfigurasi tugas pemeriksaan dan de-identifikasi. Anda dapat menggunakan huruf, angka, tanda hubung, dan garis bawah dalam nama.
Untuk InfoType display name, masukkan nama untuk infoType yang disimpan.
Anda dapat menggunakan spasi dan tanda baca dalam nama.
Untuk Deskripsi, masukkan deskripsi tentang apa yang dideteksi infoType tersimpan Anda.
Untuk Storage type, pilih lokasi daftar istilah Anda:
- BigQuery: Masukkan project ID, ID set data, dan ID tabel. Di kolom Nama kolom, masukkan ID kolom. Anda dapat menetapkan maksimal satu kolom dari tabel.
- Google Cloud Storage: Masukkan jalur ke file.
Untuk Output bucket or folder, masukkan lokasi Cloud Storage dari folder yang Anda buat di langkah 1.
Klik Create.
Ringkasan infoType yang tersimpan akan muncul. Saat kamus dibuat dan infoType baru yang disimpan siap digunakan, status infoType akan menampilkan Siap.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
- Buat folder baru untuk kamus di bucket Cloud Storage. Perlindungan Data Sensitif membuat folder yang berisi file kamus di lokasi yang Anda tentukan.
- Buat kamus menggunakan metode
storedInfoTypes.create
. Metodecreate
menggunakan parameter berikut:- Objek
StoredInfoTypeConfig
, yang berisi konfigurasi infoType yang disimpan. Hal ini mencakup:description
: Deskripsi kamus.displayName
: Nama yang ingin Anda berikan pada kamus.LargeCustomDictionaryConfig
: Berisi konfigurasi kamus kustom besar. Hal ini mencakup:BigQueryField
: Ditentukan jika daftar istilah Anda disimpan di BigQuery. Menyertakan referensi ke tabel tempat daftar Anda disimpan, serta kolom yang berisi setiap frasa kamus.CloudStorageFileSet
: Ditetapkan jika daftar istilah Anda disimpan di Cloud Storage. Menyertakan URL ke lokasi sumber di Cloud Storage, dalam bentuk berikut:"gs://[PATH_TO_GS]"
. Karakter pengganti didukung.outputPath
: Jalur ke lokasi di bucket Cloud Storage untuk menyimpan kamus yang dibuat.
storedInfoTypeId
: ID untuk infoType yang disimpan. Anda menggunakan ID ini untuk merujuk ke infoType yang disimpan saat Anda mem-build ulang, menghapus, atau menggunakannya dalam tugas inspeksi atau de-identifikasi. Jika Anda membiarkan kolom ini kosong, sistem akan membuat ID untuk Anda.
- Objek
Berikut adalah contoh JSON yang, saat dikirim ke metode storedInfoTypes.create
, membuat infoType baru yang disimpan—khususnya, pendeteksi kamus kustom besar. Contoh ini membuat infoType tersimpan dari daftar
istilah yang disimpan dalam database BigQuery
yang tersedia secara publik (bigquery-public-data.samples.github_nested
).
Database ini berisi semua nama pengguna GitHub yang digunakan dalam commit. Jalur output untuk kamus yang dihasilkan ditetapkan ke bucket Cloud Storage yang disebut dlptesting
, dan infoType yang disimpan diberi nama github-usernames
.
Input JSON
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/storedInfoTypes
{
"config":{
"displayName":"GitHub usernames",
"description":"Dictionary of GitHub usernames used in commits",
"largeCustomDictionary":{
"outputPath":{
"path":"gs://[PATH_TO_GS]"
},
"bigQueryField":{
"table":{
"datasetId":"samples",
"projectId":"bigquery-public-data",
"tableId":"github_nested"
}
}
}
},
"storedInfoTypeId":"github-usernames"
}
Membuat ulang kamus
Jika ingin memperbarui kamus, Anda harus memperbarui daftar istilah sumber terlebih dahulu, lalu menginstruksikan Sensitive Data Protection untuk membuat ulang infoType yang disimpan.
Perbarui daftar istilah sumber yang ada di Cloud Storage atau BigQuery.
Tambahkan, hapus, atau ubah istilah atau frasa sesuai kebutuhan.
Buat versi baru infoType yang disimpan dengan "mem-build ulang"-nya menggunakan Konsol Google Cloud atau metode
storedInfoTypes.patch
.Pembuatan ulang akan membuat versi baru kamus, yang menggantikan kamus lama.
Saat Anda mem-build ulang infoType yang disimpan ke versi baru, versi lama akan dihapus. Saat Sensitive Data Protection memperbarui infoType yang disimpan, statusnya adalah "tertunda". Selama waktu ini, versi lama infoType yang disimpan masih ada. Setiap pemindaian yang Anda jalankan saat infoType yang disimpan dalam status tertunda akan dijalankan menggunakan versi lama infoType yang disimpan.
Untuk mem-build ulang infoType yang tersimpan:
Konsol
- Perbarui dan simpan daftar istilah Anda di Cloud Storage atau BigQuery.
Di konsol Google Cloud, buka daftar infoTypes yang disimpan.
Klik ID infoType tersimpan yang ingin Anda perbarui.
Di halaman InfoType details, klik Rebuild data.
Perlindungan Data Sensitif akan membuat ulang infoType yang disimpan dengan perubahan yang Anda buat pada daftar istilah sumber. Setelah status infoType yang disimpan menjadi "Siap", Anda dapat menggunakannya. Semua template atau pemicu tugas yang menggunakan infoType yang disimpan akan otomatis menggunakan versi yang telah di-build ulang.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Memperbarui daftar istilah
Jika Anda hanya memperbarui daftar istilah dalam kamus kustom
besar, permintaan
storedInfoTypes.patch
Anda hanya memerlukan kolom name
. Berikan nama resource lengkap dari infoType tersimpan yang ingin Anda buat ulang.
Pola berikut mewakili entri yang valid untuk kolom name
:
organizations/ORGANIZATION_ID/storedInfoTypes/STORED_INFOTYPE_ID
projects/PROJECT_ID/storedInfoTypes/STORED_INFOTYPE_ID
Ganti STORED_INFOTYPE_ID dengan ID infoType yang disimpan yang ingin Anda buat ulang.
Jika Anda tidak mengetahui ID infoType yang disimpan, panggil metode
storedInfoTypes.list
untuk melihat daftar semua infoType yang disimpan saat ini.
Contoh
PATCH https://dlp.googleapis.com/v2/projects/PROJECT_ID/storedInfoTypes/STORED_INFOTYPE_ID
Dalam hal ini, isi permintaan tidak diperlukan.
Mengganti daftar istilah sumber
Anda dapat mengubah daftar istilah sumber untuk infoType yang disimpan
dari yang disimpan di BigQuery menjadi yang disimpan di
Cloud Storage. Gunakan metode
storedInfoTypes.patch
, tetapi sertakan objek
CloudStorageFileSet
di
LargeCustomDictionaryConfig
tempat Anda menggunakan objek
BigQueryField
sebelumnya. Kemudian, tetapkan parameter updateMask
ke parameter infoType
yang disimpan dan Anda buat ulang, dalam
format
FieldMask
. Misalnya, JSON berikut menyatakan dalam parameter updateMask
bahwa URL jalur Cloud Storage telah diperbarui (large_custom_dictionary.cloud_storage_file_set.url
):
Contoh
PATCH https://dlp.googleapis.com/v2/projects/PROJECT_ID/storedInfoTypes/github-usernames
{
"config":{
"largeCustomDictionary":{
"cloudStorageFileSet":{
"url":"gs://[BUCKET_NAME]/[PATH_TO_FILE]"
}
}
},
"updateMask":"large_custom_dictionary.cloud_storage_file_set.url"
}
Demikian pula, Anda dapat mengalihkan daftar istilah dari daftar yang disimpan di tabel BigQuery ke daftar yang disimpan di bucket Cloud Storage.
Memindai konten menggunakan pendeteksi kamus kustom besar
Memindai konten menggunakan pendeteksi kamus kustom besar mirip dengan memindai konten menggunakan pendeteksi infoType kustom lainnya.
Prosedur ini mengasumsikan bahwa Anda sudah memiliki infoType tersimpan. Untuk mengetahui informasi selengkapnya, lihat Membuat infoType tersimpan di halaman ini.
Konsol
Anda dapat menerapkan pendeteksi kamus kustom besar saat melakukan hal berikut:
- Membuat tugas baru
- Membuat atau mengedit pemicu tugas
- Membuat atau mengedit template
- Mengonfigurasi pembuatan profil data
Di bagian Configure detection pada halaman, di subbagian InfoTypes, Anda dapat menentukan infoType kamus kustom besar.
- Klik Kelola infoTypes.
- Di panel InfoTypes, klik tab Custom.
- Klik Tambahkan infoType kustom.
Di panel Tambahkan infoType kustom, lakukan tindakan berikut:
- Untuk Type, pilih Stored infoType.
- Untuk InfoType, masukkan nama untuk infoType kustom. Anda dapat menggunakan huruf, angka, dan garis bawah.
Untuk Kemungkinan, pilih tingkat kemungkinan default yang ingin Anda tentukan untuk semua temuan yang cocok dengan infoType kustom ini. Anda dapat menyetel lebih lanjut tingkat kemungkinan setiap temuan menggunakan aturan kata cepat.
Jika Anda tidak menentukan nilai default, tingkat kemungkinan default akan ditetapkan ke
VERY_LIKELY
. Untuk mengetahui informasi selengkapnya, lihat Kemungkinan kecocokan.Untuk Sensitivity, pilih tingkat sensitivitas yang ingin Anda tetapkan ke semua temuan yang cocok dengan infoType kustom ini. Jika Anda tidak menentukan nilai, tingkat sensitivitas temuan tersebut akan ditetapkan ke
HIGH
.Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Perlindungan Data Sensitif menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.
Untuk Stored infoType name, pilih infoType tersimpan yang ingin Anda gunakan sebagai dasar infoType kustom baru.
Klik Selesai untuk menutup panel Tambahkan infoType kustom.
Opsional: Di tab Built-in, edit pilihan infoType bawaan.
Klik Selesai untuk menutup panel InfoTypes.
InfoType kustom ditambahkan ke daftar infoType yang dipindai oleh Sensitive Data Protection. Namun, pilihan ini belum final hingga Anda menyimpan konfigurasi tugas, pemicu tugas, template, atau pemindaian.
Setelah selesai membuat atau mengedit konfigurasi, klik Simpan.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Saat dikirim ke metode
content.inspect
, contoh berikut akan memindai teks yang diberikan menggunakan detector infoType
yang disimpan dan ditentukan. Parameter infoType
diperlukan karena
semua infoTypes kustom harus memiliki nama
yang tidak bertentangan dengan infoTypes bawaan atau infoTypes kustom lainnya. Parameter
storedType
berisi jalur resource lengkap dari infoType yang disimpan.
Input JSON
POST https://dlp.googleapis.com/v2/projects/PROJECT_ID/content:inspect
{
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"GITHUB_LOGINS"
},
"storedType":{
"name":"projects/PROJECT_ID/storedInfoTypes/github-logins"
}
}
]
},
"item":{
"value":"The commit was made by githubuser."
}
}
Mengatasi error
Jika Anda mendapatkan error saat mencoba membuat infoType tersimpan dari daftar istilah yang disimpan di Cloud Storage, berikut adalah kemungkinan penyebabnya:
- Anda mengalami batas atas untuk infoTypes
yang disimpan. Bergantung pada masalahnya, ada beberapa solusi:
- Jika Anda mencapai batas atas untuk satu file input di Cloud Storage (200 MB), coba bagi file tersebut menjadi beberapa file. Anda dapat menggunakan beberapa file untuk menyusun satu kamus kustom selama ukuran gabungan semua file tidak melebihi 1 GB.
- BigQuery tidak memiliki batas yang sama dengan Cloud Storage. Pertimbangkan untuk memindahkan istilah ke dalam tabel BigQuery. Ukuran maksimum kolom kamus kustom di BigQuery adalah 1 GB dan jumlah baris maksimumnya adalah 5.000.000.
- Jika file daftar istilah Anda melebihi semua batas yang berlaku untuk daftar istilah sumber, Anda harus membagi file daftar istilah menjadi beberapa file dan membuat kamus untuk setiap file. Kemudian, buat tugas pemindaian terpisah untuk setiap kamus.
- Satu atau beberapa istilah Anda tidak berisi minimal satu huruf atau angka. Perlindungan Data Sensitif tidak dapat memindai istilah yang hanya terdiri dari spasi atau simbol. Nama harus memiliki minimal satu huruf atau angka. Lihat daftar istilah Anda dan lihat apakah ada istilah tersebut yang disertakan, lalu perbaiki atau hapus.
- Daftar istilah Anda berisi frasa dengan terlalu banyak "komponen". Komponen dalam konteks ini adalah urutan berkelanjutan yang hanya berisi huruf, hanya angka, atau hanya karakter nonhuruf dan nonangka seperti spasi atau simbol. Lihat daftar istilah Anda dan lihat apakah ada istilah tersebut yang disertakan, lalu perbaiki atau hapus.
- Agen layanan Sensitive Data Protection tidak memiliki akses ke
data sumber kamus atau ke bucket Cloud Storage untuk menyimpan
file kamus. Untuk memperbaiki masalah ini, berikan peran Storage Admin (
roles/storage.admin
) atau peran BigQuery Data Owner (roles/bigquery.dataOwner
) dan BigQuery Job User (roles/bigquery.jobUser
) kepada agen layanan Sensitive Data Protection.
Ringkasan API
Membuat infoType tersimpan diperlukan jika Anda membuat pendeteksi kamus kustom yang besar.
InfoType yang disimpan direpresentasikan di Sensitive Data Protection oleh objek
StoredInfoType
. Objek ini terdiri dari objek terkait berikut:
StoredInfoTypeVersion
mencakup tanggal dan waktu pembuatan serta lima pesan error terakhir yang terjadi saat versi saat ini dibuat.StoredInfoTypeConfig
berisi konfigurasi infoType yang disimpan, termasuk nama dan deskripsinya. Untuk kamus kustom besar,type
harusLargeCustomDictionaryConfig
.LargeCustomDictionaryConfig
menentukan kedua hal berikut:- Lokasi dalam Cloud Storage atau BigQuery tempat daftar frasa Anda disimpan.
- Lokasi di Cloud Storage untuk menyimpan file kamus yang dihasilkan.
StoredInfoTypeState
berisi status versi terbaru dan versi infoType tersimpan yang tertunda. Informasi status mencakup apakah infoType yang disimpan dibangun ulang, siap digunakan, atau tidak valid.
Detail pencocokan kamus
Berikut adalah panduan tentang cara Sensitive Data Protection mencocokkan kata dan frasa dalam kamus. Poin-poin ini berlaku untuk kamus kustom reguler dan besar:
- Kata dalam kamus tidak peka huruf besar/kecil. Jika kamus Anda menyertakan
Abby
, kamus akan cocok denganabby
,ABBY
,Abby
, dan sebagainya. - Semua karakter—dalam kamus atau dalam konten yang akan dipindai—selain huruf, angka, dan karakter alfabet lainnya yang terdapat dalam Basic Multilingual Plane Unicode dianggap sebagai spasi kosong saat memindai kecocokan. Jika kamus Anda
memindai
Abby Abernathy
, kamus akan cocok denganabby abernathy
,Abby, Abernathy
,Abby (ABERNATHY)
, dan sebagainya. - Karakter yang mengelilingi kecocokan apa pun harus dari jenis yang berbeda (huruf
atau angka) dengan karakter yang berdekatan dalam kata. Jika kamus Anda
memindai
Abi
, kamus akan cocok dengan tiga karakter pertamaAbi904
, tetapi tidak denganAbigail
. - Kata kamus yang berisi karakter dalam Supplementary Multilingual Plane dari standar Unicode dapat menghasilkan temuan yang tidak terduga. Contoh karakter tersebut adalah emoji, simbol ilmiah, dan skrip historis.
Huruf, angka, dan karakter alfabet lainnya didefinisikan sebagai berikut:
- Huruf: karakter dengan kategori umum
Lu
,Ll
,Lt
,Lm
, atauLo
dalam spesifikasi Unicode - Angka: karakter dengan kategori umum
Nd
dalam spesifikasi Unicode - Karakter alfabet lainnya: karakter dengan kategori umum
Nl
dalam spesifikasi Unicode atau dengan properti kontributifOther_Alphabetic
seperti yang ditentukan oleh Standar Unicode
Untuk membuat, mengedit, atau menghapus infoType tersimpan, Anda menggunakan metode berikut:
storedInfoTypes.create
: Membuat infoType tersimpan baru berdasarkanStoredInfoTypeConfig
yang Anda tentukan.storedInfoTypes.patch
: Mem-build ulang infoType yang disimpan denganStoredInfoTypeConfig
baru yang Anda tentukan. Jika tidak ada yang ditentukan, metode ini akan membuat versi baru infoType yang disimpan denganStoredInfoTypeConfig
yang ada.storedInfoTypes.get
: MengambilStoredInfoTypeConfig
dan versi yang tertunda dari infoType tersimpan yang ditentukan.storedInfoTypes.list
: Mencantumkan semua infoTypes yang saat ini disimpan.storedInfoTypes.delete
: Menghapus infoType tersimpan yang ditentukan.