Perubahan tanggal

Tanggal adalah jenis data yang sangat umum. Jika tanggal dapat dianggap sebagai data sensitif atau informasi identitas pribadi (PII), Anda mungkin perlu menyederhanakan, meng-obfuscate, atau menyamarkan tanggal tersebut.

Salah satu metode untuk melakukannya adalah generalisasi, atau pengelompokan. Namun, bergantung pada kasus penggunaan dan konfigurasi, pengelompokan dapat menghapus utilitas dalam tanggal. Misalnya, jika Anda menyamaratakan semua tanggal menjadi hanya satu tahun, Anda dapat kehilangan urutan peristiwa yang terjadi dalam tahun tersebut. Metode alternatif untuk mengaburkan tanggal yang mengatasi masalah ini adalah pergeseran tanggal.

Teknik pergeseran tanggal secara acak menggeser serangkaian tanggal, tetapi mempertahankan urutan dan durasi jangka waktu. Pergeseran tanggal biasanya dilakukan dalam konteks individu atau entitas. Artinya, tanggal setiap individu digeser dengan jumlah waktu yang unik untuk individu tersebut.

Contoh perubahan tanggal

Pertimbangkan data berikut:

user_id date action
1 2009-06-09 run
1 2009-06-03 walk
1 2009-05-23 crawling
2 2010-11-03 crawling
2 2010-11-22 walk
... ... ...

Jika Anda menggabungkan tanggal ini ke tahun, Anda akan mendapatkan:

user_id date_year action
1 2009 run
1 2009 walk
1 2009 crawling
2 2010 crawling
2 2010 walk
... ... ...

Namun, sekarang Anda tidak dapat mengetahui urutan per pengguna.

Sebagai gantinya, coba ubah tanggal:

user_id date action
1 2009-07-17 run
1 2009-07-11 walk
1 2009-06-30 crawling
2 2011-01-26 crawling
2 2011-02-14 walk
... ... ...

Perhatikan perbedaan tanggal, tetapi urutan dan durasi tetap dipertahankan. Besarnya pergeseran tanggal berbeda antara user_id 1 dan 2.

Pergeseran tanggal di Perlindungan Data Sensitif

Objek JSON untuk mengonfigurasi ini untuk metode content.deidentify Perlindungan Data Sensitif adalah sebagai berikut:

deidentify_config {
  record_transformations {
    field_transformations {
      fields {
        name: "date"
      }
      primitive_transformation {
        date_shift_config {
          upper_bound_days: 100
          lower_bound_days: -100
          entity_field_id {
            name: "user_id"
          }
          crypto_key {
            unwrapped {
              key: "123456789012345678901234567890ab"
            }
          }
        }
      }
    }
  }
}

Batas atas dan bawah pergeseran ditentukan oleh nilai upper_bound_days dan lower_bound_days. Konteks atau cakupan yang akan diterapkan oleh perubahan tersebut didasarkan pada nilai entity_id_field, yang dalam hal ini adalah "user_id".

Perhatikan juga penggunaan crypto_key. Hal ini mirip dengan cara penggunaannya dalam pseudonimisasi. Kunci ini akan memungkinkan Anda menjaga integritas pergeseran tanggal ini di beberapa permintaan atau operasi data.

Resource

Untuk informasi selengkapnya tentang cara melakukan de-identifikasi data menggunakan perubahan tanggal dan metode lainnya di Perlindungan Data Sensitif, lihat:

Untuk informasi referensi API tentang transformasi dasar di Perlindungan Data Sensitif, lihat: