Memperbaiki temuan dari profiler data

Halaman ini menjelaskan langkah-langkah yang dapat Anda lakukan untuk memperbaiki temuan dari profil data.

Risiko data tinggi

Kolom atau tabel dengan risiko data tinggi memiliki bukti informasi sensitif tanpa perlindungan tambahan. Untuk menurunkan skor risiko data, pertimbangkan untuk melakukan hal berikut:

  • Untuk kolom BigQuery yang berisi data sensitif, terapkan tag kebijakan BigQuery untuk membatasi akses ke akun dengan hak akses tertentu.

    Sebelum melakukan perubahan ini, pastikan agen layanan Anda memiliki izin yang diperlukan untuk membuat profil tabel dengan batasan tingkat kolom. Jika tidak, Perlindungan Data Sensitif akan menampilkan error. Untuk mengetahui informasi selengkapnya, lihat Memecahkan masalah data profiler.

  • Lakukan de-identifikasi data sensitif mentah menggunakan teknik de-identifikasi seperti masking dan tokenisasi.

  • Jika data berisiko tinggi tidak diperlukan, pertimbangkan untuk menghapus kolom sensitif.

Skor teks bebas yang tinggi

Kolom dengan skor teks bebas yang tinggi, terutama kolom yang memiliki bukti beberapa infoType (seperti PHONE_NUMBER, US_SOCIAL_SECURITY_NUMBER, dan DATE_OF_BIRTH), dapat berisi data tidak terstruktur dan contoh informasi identitas pribadi (PII). Kolom ini dapat berupa catatan atau kolom komentar. Teks bentuk bebas menimbulkan potensi risiko. Misalnya, dalam kolom tersebut, seseorang dapat memasukkan "Pelanggan lahir pada 1 Januari 1985".

Perlindungan Data Sensitif dibuat untuk menangani data yang tidak terstruktur. Untuk lebih memahami data semacam ini, pertimbangkan untuk melakukan hal berikut:

  • Untuk data BigQuery, Anda dapat mengidentifikasi baris atau sel tempat PII mungkin ada dengan menjalankan pemeriksaan on demand pada tabel BigQuery.

  • Lakukan de-identifikasi data sensitif mentah menggunakan teknik seperti masking dan tokenisasi.

Langkah selanjutnya