Questa serie di documenti fornisce strategie per valutare e ridurre il rischio associato ai dati nella tua organizzazione. Inoltre, descrive e mette a confronto due servizi di protezione dei dati sensibili che ti aiutano a scoprire di più sulla tua attuale posizione in termini di sicurezza dei dati.
Scopi della gestione del rischio relativo ai dati
La gestione del rischio dei dati comporta l'archiviazione, l'elaborazione e l'utilizzo dei dati nei livelli di rischio appropriati per la tua attività. Quando esegui la gestione del rischio dei dati, ti consigliamo di perseguire i seguenti obiettivi:
- I dati vengono rilevati e classificati correttamente.
- Il rischio di esposizione dei dati è compreso correttamente.
- I dati sono protetti da controlli appropriati o vengono ridotti i rischi tramite l'oscuramento.
Quando valuti i carichi di lavoro dei dati, puoi iniziare ponendoti queste domande:
- Che tipo di dati gestisce questo carico di lavoro e sono sensibili?
- Questi dati sono esposti correttamente? Ad esempio, l'accesso ai dati è limitato agli utenti giusti, nell'ambiente giusto e per una finalità approvata?
- Il rischio di questi dati può essere ridotto tramite strategie di minimizzazione e offuscamento dei dati?
Un approccio informato e basato sui rischi può aiutarti a sfruttare al meglio i tuoi dati senza compromettere la privacy dei tuoi utenti.
Esempio di analisi
Per questo esempio, supponiamo che il tuo team di dati stia cercando di creare un modello di machine learning basato sul feedback dei clienti nelle recensioni dei prodotti.
Che tipo di dati gestisce questo carico di lavoro e sono sensibili?
Nel carico di lavoro dei dati, hai scoperto che la chiave primaria utilizzata è l'indirizzo email del cliente. Gli indirizzi email dei clienti contengono spesso i loro nomi. Inoltre, le recensioni effettive dei prodotti contengono dati non strutturati (o dati di forma libera) inviati dal cliente. I dati non strutturati possono contenere istanze intermittenti di dati sensibili come numeri di telefono e indirizzi.
Questi dati sono esposti correttamente?
Hai scoperto che i dati sono accessibili solo al team di prodotto. Tuttavia, vuoi condividerli con il tuo team di analisi dei dati, in modo che possa utilizzarli per costruire un modello di machine learning. L'esposizione dei dati a più persone significa anche esporli a più ambienti di sviluppo in cui verranno archiviati ed elaborati. Hai stabilito che il rischio di esposizione aumenterà.
Il rischio di questi dati può essere ridotto tramite strategie di minimizzazione e offuscamento dei dati?
Sai che il team di analisi non ha bisogno delle informazioni sensibili che consentono l'identificazione personale (PII) nel set di dati. Tuttavia, devono aggregare i dati per cliente. Hanno bisogno di un modo per determinare quali recensioni appartengono allo stesso cliente. Per soddisfare questa esigenza, decidi di tokenizzare tutte le PII strutturate, ovvero gli indirizzi email dei clienti, per mantenere l'integrità referenziale dei dati. Decidi anche di ispezionare i dati non strutturati, ovvero le recensioni, e di mascherare eventuali dati sensibili intermittenti al loro interno.
Passaggi successivi
- Confrontare i servizi Sensitive Data Protection che ti aiutano a conoscere i tuoi dati (documento successivo di questa serie)