Tanggal adalah jenis data yang sangat umum. Jika tanggal dapat dianggap sebagai data sensitif atau informasi identitas pribadi (PII), Anda mungkin perlu menyederhanakan, meng-obfuscate, atau menyamarkan tanggal tersebut.
Salah satu metode untuk melakukannya adalah generalisasi, atau pengelompokan. Namun, bergantung pada kasus penggunaan dan konfigurasi, pengelompokan dapat menghapus utilitas dalam tanggal. Misalnya, jika Anda menyamaratakan semua tanggal menjadi hanya satu tahun, Anda dapat kehilangan urutan peristiwa yang terjadi dalam tahun tersebut. Metode alternatif untuk mengaburkan tanggal yang mengatasi masalah ini adalah pergeseran tanggal.
Teknik pergeseran tanggal secara acak menggeser serangkaian tanggal, tetapi mempertahankan urutan dan durasi jangka waktu. Pergeseran tanggal biasanya dilakukan dalam konteks individu atau entitas. Artinya, tanggal setiap individu digeser dengan jumlah waktu yang unik untuk individu tersebut.
Contoh perubahan tanggal
Pertimbangkan data berikut:
user_id | date | action |
---|---|---|
1 | 2009-06-09 | run |
1 | 2009-06-03 | walk |
1 | 2009-05-23 | crawling |
2 | 2010-11-03 | crawling |
2 | 2010-11-22 | walk |
... | ... | ... |
Jika Anda menggabungkan tanggal ini ke tahun, Anda akan mendapatkan:
user_id | date_year | action |
---|---|---|
1 | 2009 | run |
1 | 2009 | walk |
1 | 2009 | crawling |
2 | 2010 | crawling |
2 | 2010 | walk |
... | ... | ... |
Namun, sekarang Anda tidak dapat mengetahui urutan per pengguna.
Sebagai gantinya, coba ubah tanggal:
user_id | date | action |
---|---|---|
1 | 2009-07-17 | run |
1 | 2009-07-11 | walk |
1 | 2009-06-30 | crawling |
2 | 2011-01-26 | crawling |
2 | 2011-02-14 | walk |
... | ... | ... |
Perhatikan perbedaan tanggal, tetapi urutan dan durasi tetap dipertahankan.
Besarnya pergeseran tanggal berbeda antara user_id
1 dan
2.
Pergeseran tanggal di Perlindungan Data Sensitif
Objek JSON untuk mengonfigurasi ini untuk metode
content.deidentify
Perlindungan Data Sensitif adalah sebagai berikut:
deidentify_config {
record_transformations {
field_transformations {
fields {
name: "date"
}
primitive_transformation {
date_shift_config {
upper_bound_days: 100
lower_bound_days: -100
entity_field_id {
name: "user_id"
}
crypto_key {
unwrapped {
key: "123456789012345678901234567890ab"
}
}
}
}
}
}
}
Batas atas dan bawah pergeseran ditentukan oleh nilai upper_bound_days
dan lower_bound_days
. Konteks atau cakupan yang akan diterapkan oleh
perubahan tersebut didasarkan pada nilai entity_id_field
, yang dalam hal ini
adalah "user_id"
.
Perhatikan juga penggunaan crypto_key
. Hal ini mirip dengan cara
penggunaannya dalam pseudonimisasi. Kunci ini akan memungkinkan Anda
menjaga integritas pergeseran tanggal ini di beberapa permintaan atau operasi data.
Resource
Untuk informasi selengkapnya tentang cara melakukan de-identifikasi data menggunakan perubahan tanggal dan metode lainnya di Perlindungan Data Sensitif, lihat:
Untuk informasi referensi API tentang transformasi dasar di Perlindungan Data Sensitif, lihat:
- Objek
DeidentifyConfig
: Objek tempat Anda mengonfigurasi opsi de-identifikasi. - Objek
PrimitiveTransformations
: Pergeseran tanggal adalah "transformasi primitif" dalam Perlindungan Data Sensitif. - Objek
DateShiftConfig
: Objek yang digunakan untuk mengonfigurasi objekPrimitiveTransformations
. Dengan menentukan objekDateShiftConfig
, Anda dapat menggeser tanggal dengan jumlah hari acak.