Rangkaian dokumen ini memberikan strategi untuk mengevaluasi dan mengurangi risiko data di organisasi Anda. Panduan ini juga menjelaskan dan membandingkan dua layanan Sensitive Data Protection yang membantu Anda mempelajari lebih lanjut postur keamanan data Anda saat ini.
Tujuan manajemen risiko data
Mengelola risiko data mencakup penyimpanan, pemrosesan, dan penggunaan data dalam tingkat risiko yang sesuai untuk bisnis Anda. Saat melakukan pengelolaan risiko data, sebaiknya Anda menargetkan tujuan berikut:
- Data Anda ditemukan dan diklasifikasikan dengan benar.
- Risiko terpaparnya data dipahami dengan benar.
- Data dilindungi oleh kontrol yang sesuai atau dihilangkan risikonya melalui obfuscation.
Saat mengevaluasi beban kerja data, Anda dapat memulai dengan mengajukan pertanyaan berikut:
- Jenis data apa yang ditangani oleh beban kerja ini dan apakah ada data yang bersifat sensitif?
- Apakah data ini ditampilkan dengan benar? Misalnya, apakah akses ke data dibatasi untuk pengguna yang tepat, di lingkungan yang tepat, dan untuk tujuan yang disetujui?
- Dapatkah risiko data ini dikurangi melalui strategi obfuscation dan pengurangan data?
Mengambil pendekatan yang didasarkan pada risiko dan informasi yang memadai dapat membantu Anda memaksimalkan data tanpa mengorbankan privasi pengguna.
Contoh analisis
Untuk contoh ini, misalkan tim data Anda mencoba membuat model machine learning berdasarkan masukan pelanggan dalam ulasan produk.
Jenis data apa yang ditangani oleh beban kerja ini dan apakah ada data sensitif?
Dalam beban kerja data, Anda menemukan bahwa kunci utama yang digunakan adalah alamat email pelanggan. Alamat email pelanggan sering kali berisi nama pelanggan. Selain itu, ulasan produk yang sebenarnya berisi data tidak terstruktur (atau data bebas) yang dikirimkan oleh pelanggan. Data tidak terstruktur dapat berisi instance data sensitif seperti nomor telepon dan alamat.
Apakah data ini ditampilkan dengan benar?
Anda mendapati bahwa data hanya dapat diakses oleh tim produk. Namun, Anda ingin membagikan data tersebut kepada tim analisis data, sehingga mereka dapat menggunakannya untuk membuat model machine learning. Mengekspos data kepada lebih banyak orang juga berarti mengeksposnya ke lebih banyak lingkungan pengembangan tempat data ini akan disimpan dan diproses. Anda memutuskan bahwa risiko eksposur akan meningkat.
Dapatkah risiko data ini dikurangi melalui strategi obfuscation dan pengurangan data?
Anda tahu bahwa tim analisis tidak memerlukan informasi identitas pribadi (PII) sensitif yang sebenarnya dalam set data. Namun, mereka perlu menggabungkan data per pelanggan. Mereka memerlukan cara untuk menentukan ulasan mana yang berasal dari pelanggan yang sama. Untuk memenuhi kebutuhan ini, Anda memutuskan untuk membuat token semua PII terstruktur—alamat email pelanggan—untuk mempertahankan integritas referensi data Anda. Anda juga memutuskan untuk memeriksa data tidak terstruktur—ulasan—dan menyamarkan data sensitif yang muncul sesekali di dalamnya.
Langkah selanjutnya
- Membandingkan layanan Perlindungan Data Sensitif yang membantu Anda mempelajari data Anda (dokumen berikutnya dalam seri ini)