Panduan ini menjelaskan cara menggunakan Perlindungan Data Sensitif dengan Cloud Data Fusion.
Cloud Data Fusion menyediakan plugin Perlindungan Data Sensitif yang menyediakan tiga transformasi yang dapat memfilter, menyamarkan, atau mendekripsi data sensitif Anda:
Transformasi Filter PII memungkinkan Anda memfilter data sensitif dari aliran data input.
Transformasi Redact memungkinkan Anda mengubah data sensitif, seperti menyamar data atau mengenkripsinya.
Transformasi Dekripsi memungkinkan Anda mendekripsi data sensitif yang sebelumnya dienkripsi menggunakan transformasi Samarkan,
Biaya
Dalam dokumen ini, Anda akan menggunakan komponen Google Cloudyang dapat ditagih berikut:
Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda,
gunakan kalkulator harga.
Sebelum memulai
Di konsol Google Cloud, buka halaman pemilih project, lalu pilih atau buat project.
Aktifkan Cloud Data Fusion API untuk project Anda.
Aktifkan DLP API (bagian dari Perlindungan Data Sensitif) untuk project Anda.
Memberikan izin Sensitive Data Protection
Di Konsol Google Cloud, buka halaman IAM.
Di tabel izin, pilih salah satu akun layanan berikut di kolom Prinsipal:
Untuk izin ke resource saat runtime, pilih akun layanan yang digunakan oleh cluster Dataproc Anda. Default-nya adalah akun layanan Compute Engine, yang tidak direkomendasikan karena alasan keamanan
Untuk izin ke resource saat menggunakan Wrangler atau Pratinjau di Cloud Data Fusion (bukan saat runtime), pilih akun layanan yang cocok dengan format:
service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com
.
Klik ikon pensil di sebelah kanan akun layanan.
Klik Add Another Role.
Klik dropdown yang muncul.
Gunakan kotak penelusuran untuk melakukan penelusuran, lalu pilih DLP Administrator.
Klik Save. Pastikan DLP Administrator muncul di kolom Role.
Men-deploy plugin Perlindungan Data Sensitif
Buka instance Anda:
Di konsol Google Cloud, buka halaman Cloud Data Fusion.
Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.
Di UI web Cloud Data Fusion, klik Hub di kanan atas.
Klik plugin Pencegahan Kebocoran Data.
Klik Deploy.
Klik Selesai.
Klik Buat pipeline.
Menggunakan transformasi Filter PII
Transformasi ini memisahkan data sensitif dari data non-sensitif. Kumpulan data dianggap sensitif jika cocok dengan kriteria yang Anda tentukan dalam template Perlindungan Data Sensitif. Misalnya, saat membuat template, Anda dapat menentukan data sensitif sebagai informasi kartu kredit atau nomor Jaminan Sosial.
Buka pipeline Anda di Cloud Data Fusion, lalu klik Studio > Transform.
Klik transformasi PII Filter.
Arahkan kursor ke node Filter PII, lalu klik Properti.
Di bagian Filter pada, pilih apakah Anda ingin memfilter data atau kolom.
Sesuai dengan Batas Sensitive Data Protection, jika data melebihi 0,5 MB, pipeline Cloud Data Fusion Anda akan gagal. Untuk menghindari kegagalan tersebut, filter menurut kolom, bukan data.
Di bagian Template ID, masukkan ID template template Perlindungan Data Sensitif yang Anda buat.
Di bagian Penanganan Error, tentukan cara melanjutkan saat pipeline Anda menemukan data sensitif. Pilih salah satu opsi penanganan error berikut:
- Stop pipeline: Menghentikan pipeline segera setelah error terjadi.
- Lewati data: Melewati data yang menyebabkan error. Pipeline terus berjalan, dan tidak ada error yang dilaporkan.
- Kirim ke error: Mengirim error ke port error. Pipeline akan terus berjalan.
Klik tombol X.
Menggunakan transformasi Samarkan
Transformasi ini mengidentifikasi data sensitif dalam aliran input dan menerapkan transformasi yang Anda tentukan ke data tersebut. Kumpulan data dianggap sensitif jika cocok dengan filter Perlindungan Data Sensitif standar yang Anda pilih atau template kustom yang Anda tentukan.
Di halaman Studio pada UI web Cloud Data Fusion, klik untuk meluaskan menu Transform.
Klik transformasi Redact.
Arahkan kursor ke node Redact, lalu klik Properties.
Pilih apakah Anda ingin menerapkan transformasi ke filter standar atau ingin membuat filter sendiri.
Anda tidak dapat menggabungkan kedua opsi ini. Anda dapat menggunakan filter standar ATAU membuat template kustom.
Filter standar
Untuk menerapkan transformasi ke filter standar, biarkan Template Kustom ditetapkan ke Tidak, dan di bagian Pencocokan, tentukan aturan:
Setelah mengklik Terapkan, klik menu dropdown, lalu pilih transformasi. Pelajari lebih lanjut transformasi yang tersedia di bagian Deskripsi pada tab Dokumentasi plugin.
Setelah aktif, klik dropdown dan pilih kategori, yang merupakan kumpulan filter Perlindungan Data Sensitif standar yang dikelompokkan menurut jenis. Untuk mengetahui daftar lengkap kategori yang disediakan dan filter yang dikandungnya, lihat bagian Pemetaan Filter DLP di tab Dokumentasi plugin.
Untuk menetapkan beberapa aturan pencocokan, klik tombol +.
Template kustom
Untuk menerapkan transformasi sesuai dengan template kustom, tetapkan Template Kustom ke Ya.
Kembali ke UI web Cloud Data Fusion, di menu Redact properties, di bagian Template ID, masukkan ID template template kustom yang Anda buat.
Klik tombol X.
Menggunakan transformasi Dekripsi
Transformasi ini mengidentifikasi data yang dienkripsi menggunakan Perlindungan Data Sensitif di aliran input dan menerapkan dekripsi. Hanya data yang dienkripsi menggunakan algoritma yang dapat dibalik seperti Format Preserving Encryption atau Deterministic Encryption yang dapat didekripsi.
Di halaman Studio pada UI web Cloud Data Fusion, klik untuk meluaskan menu Transform.
Klik transformasi Dekripsi.
Arahkan kursor ke node Dekripsi, lalu klik Properti.
Masukkan nilai yang sama dengan yang digunakan untuk mengonfigurasi plugin Sembunyikan yang mengenkripsi data ini. Properti untuk plugin ini identik dengan plugin Redact.
Klik tombol X.
Langkah selanjutnya
- Ikuti tutorial untuk menyamarkan data pengguna yang sensitif.
- Baca selengkapnya tentang Perlindungan Data Sensitif.