Questa serie di documenti fornisce strategie per valutare e attenuare i rischi legati ai dati nella tua organizzazione. Inoltre, descrive e confronta due servizi di protezione dei dati sensibili che ti consentono di saperne di più sulla tua attuale strategia di sicurezza dei dati.
Scopi della gestione del rischio dei dati
La gestione del rischio dei dati comporta l'archiviazione, l'elaborazione e l'utilizzo dei dati entro i livelli di rischio appropriati per la tua azienda. Quando esegui la gestione del rischio dei dati, ti consigliamo di puntare ai seguenti obiettivi:
- I tuoi dati sono rilevati e classificati in modo appropriato.
- Il rischio di esposizione dei dati è stato compreso correttamente.
- I dati sono protetti da controlli appropriati o sono ridotti a rischio mediante l'offuscamento.
Durante la valutazione dei carichi di lavoro di dati, puoi iniziare ponendo queste domande:
- Che tipo di dati gestisce questo carico di lavoro e alcuni sono sensibili?
- Questi dati sono esposti correttamente? ad esempio se l'accesso ai dati è limitato agli utenti giusti, nell'ambiente giusto e per uno scopo approvato?
- È possibile ridurre il rischio di questi dati tramite strategie di minimizzazione dei dati e offuscamento?
Adottare un approccio ben informato e basato sul rischio può aiutarti a ottenere il massimo dai tuoi dati senza compromettere la privacy dei tuoi utenti.
Analisi di esempio
Per questo esempio, supponi che il tuo team dedicato ai dati stia cercando di creare un modello di machine learning basato sul feedback dei clienti nelle recensioni prodotto.
Che tipo di dati gestisce questo carico di lavoro e alcuni sono sensibili?
Nel carico di lavoro dei dati, hai scoperto che la chiave primaria utilizzata è l'indirizzo email del cliente. Gli indirizzi email dei clienti spesso contengono i loro nomi. Inoltre, le effettive recensioni dei prodotti contengono dati non strutturati (o dati in formato libero) inviati dal cliente. I dati non strutturati possono contenere istanze intermittenti di dati sensibili come numeri di telefono e indirizzi.
Questi dati sono esposti correttamente?
Hai rilevato che i dati sono accessibili solo al team di prodotto. Tuttavia, vuoi condividere i dati con il tuo team di analisi dei dati, in modo che possa utilizzarli per creare un modello di machine learning. Esporre i dati a più persone significa anche esporli a più ambienti di sviluppo in cui verranno archiviati ed elaborati. Hai stabilito che il rischio di esposizione aumenterà.
È possibile ridurre il rischio di questi dati tramite le strategie di minimizzazione e offuscamento dei dati?
Sai che il team di analisi non ha bisogno delle effettive informazioni sensibili che consentono l'identificazione personale (PII) nel set di dati. Tuttavia, deve aggregare i dati per cliente. Hanno bisogno di un modo per stabilire quali recensioni appartengono allo stesso cliente. Per soddisfare questa esigenza, decidi di tokenizzare tutte le PII strutturate, ovvero gli indirizzi email dei clienti, per mantenere l'integrità referenziale dei tuoi dati. Decidi anche di esaminare i dati non strutturati (le revisioni) e mascherare eventuali dati sensibili intermittenti al loro interno.
Passaggi successivi
- Confronta i servizi di Sensitive Data Protection che ti consentono di ottenere informazioni sui tuoi dati (documento successivo di questa serie)