Rangkaian dokumen ini memberikan strategi untuk mengevaluasi dan memitigasi risiko data di organisasi Anda. Panduan ini juga menjelaskan dan membandingkan dua layanan Perlindungan Data Sensitif yang membantu Anda mempelajari lebih lanjut postur keamanan data Anda saat ini.
Tujuan manajemen risiko data
Pengelolaan risiko data mencakup penyimpanan, pemrosesan, dan penggunaan data pada tingkat risiko yang sesuai untuk bisnis Anda. Saat Anda melakukan pengelolaan risiko data, sebaiknya capai tujuan berikut:
- Data Anda ditemukan dan diklasifikasikan dengan benar.
- Risiko eksposur data dipahami dengan benar.
- Data dilindungi oleh kontrol yang sesuai atau dihapus risikonya melalui obfuscation.
Saat mengevaluasi beban kerja data, Anda dapat mulai dengan mengajukan pertanyaan-pertanyaan berikut:
- Jenis data apa yang ditangani oleh beban kerja ini dan apakah ada yang sensitif?
- Apakah data ini terekspos dengan benar? Misalnya, apakah akses ke data dibatasi untuk pengguna yang tepat, di lingkungan yang tepat, dan untuk tujuan yang disetujui?
- Dapatkah risiko data ini dikurangi melalui strategi minimalisasi data dan obfuscation?
Mengambil pendekatan yang tepat dan berbasis risiko dapat membantu Anda mendapatkan hasil maksimal dari data tanpa mengorbankan privasi pengguna.
Contoh analisis
Untuk contoh ini, misalkan tim data Anda mencoba membangun model machine learning berdasarkan masukan pelanggan dalam ulasan produk.
Jenis data apa yang ditangani oleh beban kerja ini dan apakah ada yang sensitif?
Dalam beban kerja data, Anda menemukan bahwa kunci utama yang digunakan adalah alamat email pelanggan. Alamat email pelanggan sering kali berisi nama pelanggan. Selain itu, ulasan produk yang sebenarnya berisi data tidak terstruktur (atau data bentuk bebas) yang dikirimkan oleh pelanggan. Data yang tidak terstruktur dapat berisi instance data sensitif berselang-seling seperti nomor telepon dan alamat.
Apakah data ini terekspos dengan benar?
Anda menemukan bahwa data hanya dapat diakses oleh tim produk. Namun, Anda ingin berbagi data dengan tim analisis data agar mereka dapat menggunakannya untuk membangun model machine learning. Mengekspos data ke lebih banyak orang juga berarti memaparkan data ke lebih banyak lingkungan pengembangan tempat data ini akan disimpan dan diproses. Anda memutuskan bahwa risiko eksposur akan meningkat.
Dapatkah risiko data ini dikurangi melalui strategi minimalisasi data dan obfuscation?
Anda tahu bahwa tim analisis tidak memerlukan informasi identitas pribadi (PII) sensitif yang sebenarnya dalam set data. Namun, mereka perlu menggabungkan data per pelanggan. Mereka perlu cara untuk menentukan ulasan mana dari pelanggan yang sama. Untuk mengatasi kebutuhan ini, Anda memutuskan untuk membuat token semua PII terstruktur—alamat email pelanggan—untuk menjaga integritas referensial data Anda. Anda juga memutuskan untuk memeriksa data tidak terstruktur—ulasan—dan menyamarkan data sensitif yang berselang-seling di dalamnya.
Langkah selanjutnya
- Membandingkan layanan Perlindungan Data Sensitif yang membantu Anda mempelajari data (dokumen berikutnya dalam rangkaian ini)