Cloud Data Loss Prevention (Cloud DLP) ora fa parte di Sensitive Data Protection. Il nome dell'API rimane invariato: API Cloud Data Loss Prevention (API DLP). Per informazioni sui servizi che compongono Sensitive Data Protection, consulta la panoramica di Sensitive Data Protection.

Questa pagina è stata tradotta dall'API Cloud Translation.

Misurazione del rischio di reidentificazione e divulgazione

L'analisi del rischio di reidentificazione, o semplicemente analisi del rischio, è il processo di analisi dei dati sensibili per trovare proprietà che potrebbero aumentare il rischio di identificazione dei soggetti. Puoi utilizzare i metodi di analisi del rischio prima dell'anonimizzazione per determinare una strategia efficace o dopo l'anonimizzazione per monitorare eventuali modifiche o valori anomali.

k Se non hai familiarità con l'analisi del rischio o con queste metriche, consulta l'argomento sull'analisi del rischio prima di continuare.

Questa sezione fornisce panoramiche su come utilizzare Sensitive Data Protection per l'analisi del rischio dei dati strutturati utilizzando una qualsiasi di queste metriche, oltre ad altri argomenti correlati.

Calcolare il rischio di reidentificazione

Sensitive Data Protection può analizzare i dati strutturati archiviati nelle tabelle BigQuery e calcolare le seguenti metriche del rischio di reidentificazione. Fai clic sul link della metrica che vuoi calcolare per saperne di più.

Metrica	Descrizione
k-anonimità	Una proprietà di un set di dati che indica la reidentificabilità dei suoi record. Un set di dati è k-anonymous se i quasi-identificatori per ogni persona nel set di dati sono identici ad almeno k – 1 altre persone nel set di dati.
l-diversity	Un'estensione di k-anonymity che misura anche la diversità dei valori sensibili per ogni colonna in cui si presentano. Un set di dati ha l-diversity se, per ogni insieme di righe con quasi-identificatori identici, esistono almeno l valori distinti per ciascun attributo sensibile.
k-map	Calcola il rischio di reidentificazione confrontando un determinato set di dati anonimizzati di soggetti con un set di dati di reidentificazione o "attacco" più ampio.
δ-presence	Stima la probabilità che un determinato utente di una popolazione più ampia sia presente nel set di dati. Questo viene utilizzato quando l'appartenenza al set di dati è di per sé un'informazioni sensibili.

Calcolare altre statistiche

Sensitive Data Protection può anche calcolare statistiche numeriche e categoriche per i dati archiviati nelle tabelle BigQuery utilizzando la stessa risorsa DlpJob delle API di analisi del rischio.

Metrica	Descrizione
Statistiche numeriche	Determina i valori minimo, massimo e quantile per una singola colonna BigQuery.
Statistiche numeriche categoriche	Calcola le statistiche numeriche categoriche per i singoli bucket dell'istogramma all'interno di una colonna BigQuery.

Per maggiori informazioni, vedi Calcolo delle statistiche numeriche e di classificazione.

Visualizzare il rischio di reidentificazione

Puoi visualizzare le metriche di rischio calcolate da Sensitive Data Protection direttamente nella Google Cloud console utilizzando Sensitive Data Protection (k-anonimity o l-diversity) o utilizzando altri prodottiGoogle Cloud .

Prodotto	Descrizione
Looker Studio	Dopo aver calcolato i valori di k-anonimato per un set di dati utilizzando Sensitive Data Protection, puoi visualizzare i risultati in Looker Studio. In questo modo, potrai anche comprendere meglio il rischio di reidentificazione e valutare i compromessi in termini di utilità che potresti fare se oscuri o deidentifichi i dati.