Menggunakan Sensitive Data Protection dengan Cloud Data Fusion

Panduan ini menjelaskan cara menggunakan Perlindungan Data Sensitif dengan Cloud Data Fusion.

Cloud Data Fusion menyediakan plugin Sensitive Data Protection yang menyediakan tiga transformasi yang dapat memfilter, menyamarkan, atau mendekripsi data sensitif Anda:

  • Transformasi Filter PII memungkinkan Anda memfilter catatan sensitif dari aliran data input.

  • Transformasi Samarkan memungkinkan Anda mengubah data sensitif, seperti menyamarkan data atau mengenkripsinya.

  • Transformasi Decrypt memungkinkan Anda mendekripsi data sensitif yang sebelumnya dienkripsi menggunakan transformasi Redact,

Biaya

Dalam dokumen ini, Anda akan menggunakan komponen Google Cloudyang dapat ditagih berikut:

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.

Pengguna Google Cloud baru mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Sebelum memulai

  1. Di Google Cloud konsol, buka halaman pemilih project, lalu pilih atau buat project.

    Buka pemilih project

  2. Aktifkan Cloud Data Fusion API untuk project Anda.

    Aktifkan Cloud Data Fusion API

  3. Aktifkan DLP API (bagian dari Perlindungan Data Sensitif) untuk project Anda.

    Mengaktifkan DLP API

  4. Buat instance Cloud Data Fusion.

Memberikan izin Sensitive Data Protection

  1. Di konsol Google Cloud , buka halaman IAM.

    Buka IAM

  2. Di tabel izin, pilih salah satu akun layanan berikut di kolom Principal:

    1. Untuk izin ke resource saat runtime, pilih akun layanan yang digunakan cluster Dataproc Anda. Defaultnya adalah akun layanan Compute Engine, yang tidak direkomendasikan karena alasan keamanan

    2. Untuk izin ke resource saat menggunakan Wrangler atau Pratinjau di Cloud Data Fusion (bukan saat runtime), pilih akun layanan yang cocok dengan format: service-project-number@gcp-sa-datafusion..

  3. Klik ikon pensil di sebelah kanan akun layanan.

  4. Klik Add Another Role.

  5. Klik dropdown yang muncul.

  6. Gunakan kotak penelusuran untuk menelusuri, lalu pilih Administrator DLP.

  7. Klik Simpan. Pastikan Administrator DLP muncul di kolom Peran.

Men-deploy plugin Sensitive Data Protection

  1. Buka instance Anda:

    1. Di konsol Google Cloud , buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Di UI web Cloud Data Fusion, klik Hub di kanan atas.

  3. Klik plugin Pencegahan Kebocoran Data.

  4. Klik Deploy.

  5. Klik Selesai.

  6. Klik Buat pipeline.

Menggunakan transformasi Filter PII

Transformasi ini memisahkan data sensitif dari data non-sensitif. Record dianggap sensitif jika cocok dengan kriteria yang Anda tentukan dalam template Perlindungan Data Sensitif. Misalnya, saat membuat template, Anda dapat menentukan data sensitif sebagai informasi kartu kredit atau nomor Jaminan Sosial.

  1. Buat template inspeksi Sensitive Data Protection.

  2. Buka pipeline Anda di Cloud Data Fusion, lalu klik Studio > Transformasi.

  3. Klik transformasi Filter PII.

  4. Arahkan pointer ke node Filter PII, lalu klik Properti.

  5. Di bagian Filter pada, pilih apakah Anda ingin memfilter rekaman atau kolom.

    Sesuai dengan batas Sensitive Data Protection, jika sebuah rekaman melebihi 0,5 MB, pipeline Cloud Data Fusion Anda akan gagal. Untuk menghindari kegagalan tersebut, filter menurut kolom, bukan menurut data.

  6. Di bagian Template ID, masukkan ID template dari template Perlindungan Data Sensitif yang Anda buat.

  7. Di bagian Penanganan Error, tentukan cara melanjutkan saat pipeline Anda menemukan data sensitif. Pilih salah satu opsi penanganan error berikut:

    • Hentikan pipeline: Menghentikan pipeline segera setelah terjadi error.
    • Lewati rekaman: Melewati rekaman yang menyebabkan error. Pipeline terus berjalan, dan tidak ada error yang dilaporkan.
    • Kirim ke error: Mengirim error ke port error. Pipeline terus berjalan.
  8. Klik tombol X.

Menggunakan transformasi Samarkan

Transformasi ini mengidentifikasi rekaman sensitif dalam aliran input dan menerapkan transformasi yang Anda tentukan ke rekaman tersebut. Kumpulan data dianggap sensitif jika cocok dengan filter Perlindungan Data Sensitif standar yang Anda pilih atau template kustom yang Anda tentukan.

  1. Di halaman Studio pada UI web Cloud Data Fusion, klik untuk meluaskan menu Transform.

  2. Klik transformasi Redact.

  3. Arahkan kursor ke node Redact, lalu klik Properties.

  4. Pilih apakah Anda ingin menerapkan transformasi ke filter standar atau apakah Anda ingin membuat filter sendiri.

    Anda tidak dapat menggabungkan kedua opsi ini. Anda dapat menggunakan filter standar ATAU membuat template kustom.

    Filter standar

    Untuk menerapkan transformasi ke filter standar, biarkan Template Kustom disetel ke Tidak, dan di bagian Pencocokan, tentukan aturan:

    1. Setelah Terapkan, klik dropdown, lalu pilih transformasi. Pelajari lebih lanjut transformasi yang tersedia di bagian Deskripsi pada tab Dokumentasi plugin.

    2. Setelah diaktifkan, klik dropdown dan pilih kategori, yang merupakan sekumpulan filter Sensitive Data Protection standar yang dikelompokkan menurut jenisnya. Untuk mengetahui daftar lengkap kategori yang disediakan dan filter yang ada di dalamnya, lihat bagian Pemetaan Filter DLP di tab Dokumentasi plugin.

    Untuk menetapkan beberapa aturan pencocokan, klik tombol +.

    Template kustom

    Untuk menerapkan transformasi sesuai dengan template kustom, tetapkan Template Kustom ke Ya.

    1. Buat template Sensitive Data Protection kustom.

    2. Kembali di UI web Cloud Data Fusion, di menu Redact properties, di bagian Template ID, masukkan ID template kustom yang Anda buat.

  5. Klik tombol X.

Menggunakan transformasi Dekripsi

Transformasi ini mengidentifikasi rekaman yang dienkripsi menggunakan Perlindungan Data Sensitif dalam aliran input dan menerapkan dekripsi. Hanya data yang dienkripsi menggunakan algoritma yang dapat dibalik seperti Format Preserving Encryption atau Deterministic Encryption yang dapat didekripsi.

  1. Di halaman Studio pada UI web Cloud Data Fusion, klik untuk meluaskan menu Transform.

  2. Klik transformasi Decrypt.

  3. Arahkan pointer ke node Decrypt, lalu klik Properties.

  4. Masukkan nilai yang sama dengan yang digunakan untuk mengonfigurasi plugin Redact yang mengenkripsi data ini. Properti untuk plugin ini identik dengan plugin Redact.

  5. Klik tombol X.

Langkah berikutnya