L-diversity è una proprietà di un set di dati e un'estensione di k-anonymity che misura la diversità dei valori sensibili per ogni colonna in cui si presentano. Un set di dati ha l-diversity se, per ogni insieme di righe con quasi-identificatori identici, esistono almeno l valori distinti per ciascun attributo sensibile.
Puoi calcolare il valore l-diversity in base a una o più colonne o campi di un set di dati. Questo argomento illustra come calcolare i valori l-diversity per un set di dati utilizzando Sensitive Data Protection. Per ulteriori informazioni sull'analisi della l-diversità o del rischio in generale, consulta l'argomento del concetto di analisi del rischio prima di continuare.
Prima di iniziare
Prima di continuare, assicurati di aver eseguito le seguenti operazioni:
- Accedi al tuo Account Google.
- Nella pagina del selettore progetti della console Google Cloud, seleziona o crea un progetto Google Cloud. Vai al selettore dei progetti
- Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud. Scopri come verificare che la fatturazione sia abilitata per il tuo progetto.
- Attiva Sensitive Data Protection. Abilita Sensitive Data Protection
- Seleziona un set di dati BigQuery da analizzare. Sensitive Data Protection calcola la metrica l-diversity analizzando una tabella BigQuery.
- Determina un identificatore di campo sensibile (se applicabile) e almeno un quasi-identificatore nel set di dati. Per ulteriori informazioni, consulta la pagina Termini e tecniche di analisi del rischio.
Calcola l-diversity
Sensitive Data Protection esegue l'analisi del rischio ogni volta che viene eseguito un job di analisi del rischio. Devi prima creare il job utilizzando la console Google Cloud, inviando una richiesta API DLP o utilizzando una libreria client di Sensitive Data Protection.
Console
Nella console Google Cloud, vai alla pagina Crea analisi del rischio.
Nella sezione Scegli i dati di input, specifica la tabella BigQuery da analizzare inserendo l'ID del progetto che contiene la tabella, l'ID del set di dati della tabella e il nome della tabella.
In Metrica di privacy da calcolare, seleziona l-diversity.
Nella sezione ID job, puoi scegliere di assegnare al job un identificatore personalizzato e selezionare una località delle risorse in cui Sensitive Data Protection elaborerà i dati. Al termine, fai clic su Continua.
Nella sezione Definisci campi, specifichi campi sensibili e quasi-identificatori per il job di rischio l-diversity. Sensitive Data Protection accede ai metadati della tabella BigQuery specificata nel passaggio precedente e tenta di compilare l'elenco dei campi.
- Seleziona la casella di controllo appropriata per specificare un campo come campo sensibile (S) o quasi-identificatore (QI). Devi selezionare 1 campo sensibile e almeno 1 quasi-identificatore.
- Se Sensitive Data Protection non è in grado di compilare i campi, fai clic su Inserisci il nome di un campo per inserire manualmente uno o più campi e impostare ciascuno di essi come campo sensibile o quasi-identificatore. Al termine, fai clic su Continua.
Nella sezione Aggiungi azioni, puoi aggiungere azioni facoltative da eseguire quando il job relativo ai rischi viene completato. Le opzioni disponibili sono:
- Salva in BigQuery: salva i risultati dell'analisi dell'analisi del rischio in una tabella BigQuery.
Pubblica in Pub/Sub: pubblica una notifica in un argomento Pub/Sub.
Notifica via email. Ti invia un'email con i risultati. Al termine, fai clic su Crea.
Il job di analisi del rischio l-diversity inizia immediatamente.
C#
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Go
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
PHP
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
REST
Per eseguire un nuovo job di analisi del rischio per calcolare l-diversity, invia una richiesta alla risorsa projects.dlpJobs
, dove PROJECT_ID indica l'identificatore di progetto:
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs
La richiesta contiene un oggetto RiskAnalysisJobConfig
, composto da quanto segue:
Un oggetto
PrivacyMetric
. Qui specifichi che stai calcolando l-diversity includendo un oggettoLDiversityConfig
.Un oggetto
BigQueryTable
. Specifica la tabella BigQuery da analizzare includendo tutti i seguenti elementi:projectId
: l'ID del progetto contenente la tabella.datasetId
: l'ID del set di dati della tabella.tableId
: il nome della tabella.
Un insieme di uno o più oggetti
Action
, che rappresentano le azioni da eseguire, nell'ordine indicato, al completamento del job. Ogni oggettoAction
può contenere una delle seguenti azioni:- Oggetto
SaveFindings
: salva i risultati dell'analisi dell'analisi del rischio in una tabella BigQuery. PublishToPubSub
object: pubblica una notifica in un argomento Pub/Sub.Oggetto
JobNotificationEmails
: ti invia un'email con i risultati.
All'interno dell'oggetto
LDiversityConfig
, specifichi quanto segue:quasiIds[]
: un insieme di quasi-identificatori (oggettiFieldId
) che indicano come vengono definite le classi di equivalenza per il calcolo di l-diversity. Come conKAnonymityConfig
, quando specifichi più campi, questi vengono considerati come una singola chiave composita.sensitiveAttribute
: campo sensibile (oggettoFieldId
) per calcolare il valore l-diversity.
- Oggetto
Non appena invii una richiesta all'API DLP, viene avviato il job di analisi del rischio.
Elenca job di analisi del rischio completati
Puoi visualizzare un elenco dei job di analisi del rischio eseguiti nel progetto attuale.
Console
Per elencare i job di analisi del rischio in esecuzione e in precedenza nella console Google Cloud:
Nella console Google Cloud, apri Sensitive Data Protection.
Fai clic sulla scheda Job e trigger di job nella parte superiore della pagina.
Fai clic sulla scheda Job di rischio.
Viene visualizzato l'elenco delle offerte di lavoro per i rischi.
Protocollo
Per elencare i job di analisi del rischio in esecuzione e in precedenza, invia una richiesta GET alla risorsa projects.dlpJobs
. L'aggiunta di un filtro per il tipo di job (?type=RISK_ANALYSIS_JOB
) restringe la risposta solo ai job di analisi del rischio.
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs?type=RISK_ANALYSIS_JOB
La risposta che ricevi contiene una rappresentazione JSON di tutti i job di analisi del rischio attuali e precedenti.
Visualizza i risultati dei job l-diversity
Sensitive Data Protection nella console Google Cloud offre visualizzazioni integrate per i job l-diversity completati. Dopo aver seguito le istruzioni riportate nella sezione precedente, seleziona il job di cui vuoi visualizzare i risultati dall'elenco dei job di analisi del rischio. Supponendo che il job sia stato eseguito correttamente, la parte superiore della pagina Dettagli dell'analisi del rischio sarà simile alla seguente:
Nella parte superiore della pagina sono riportate informazioni sul job di rischio l-diversity, inclusi il relativo ID job e, in Container, la località delle risorse.
Per visualizzare i risultati del calcolo di l-diversity, fai clic sulla scheda L-diversity. Per visualizzare la configurazione del job di analisi del rischio, fai clic sulla scheda Configurazione.
La scheda L-diversity elenca innanzitutto il valore sensibile e i quasi-identificatori utilizzati per calcolare l-diversity.
Grafico del rischio
Il grafico Rischio di reidentificazione traccia, sull'asse y, la percentuale potenziale di perdita di dati sia per le righe univoche che per le combinazioni di quasi-identificatori univoche per ottenere, sull'asse x, un valore l-diversità. Il colore del grafico indica anche il potenziale di rischio. Le tonalità di blu più scure indicano un rischio maggiore, mentre le tonalità più chiare indicano un rischio minore.
Valori di l-diversity più elevati indicano una minore diversità di valori, il che può rendere un set di dati meno reidentificabile e più sicuro. Per ottenere valori di l-diversità più elevati, tuttavia, dovresti rimuovere percentuali più elevate delle righe totali e combinazioni di quasi-identificatori unici più elevate, il che potrebbe diminuire l'utilità dei dati. Per visualizzare un valore specifico di perdita percentuale potenziale per un determinato valore l-diversity, passa il mouse sopra il grafico. Come mostrato nello screenshot, nel grafico viene visualizzata una descrizione comando.
Per visualizzare ulteriori dettagli su un valore l-diversity specifico, fai clic sul punto dati corrispondente. Una spiegazione dettagliata viene mostrata sotto il grafico, mentre una tabella di dati di esempio appare più in basso nella pagina.
Tabella dati di esempio sul rischio
Il secondo componente della pagina dei risultati del job di rischio è la tabella dei dati di esempio. Mostra combinazioni di quasi-identificatori per un determinato valore target l-diversity.
Nella prima colonna della tabella sono elencati i valori k-anonymity. Fai clic su un valore l-diversity per visualizzare i dati di esempio corrispondenti che dovrebbero essere eliminati per raggiungere questo valore.
La seconda colonna mostra la rispettiva potenziale perdita di dati di righe univoche e combinazioni di quasi-identificatori per ottenere il valore l-diversity selezionato, così come il numero di gruppi con almeno l attributi sensibili e il numero totale di record.
L'ultima colonna mostra un campione di gruppi che condividono una combinazione di quasi-identificatori, insieme al numero di record esistenti per quella combinazione.
Recupera i dettagli del job utilizzando REST
Per recuperare i risultati del job di analisi del rischio l-diversity utilizzando l'API REST, invia la seguente richiesta GET alla risorsa projects.dlpJobs
. Sostituisci PROJECT_ID con l'ID progetto e JOB_ID con l'identificatore del job per cui vuoi ottenere risultati.
L'ID job è stato restituito quando hai avviato il job e può anche essere recuperato elencando tutti i job.
GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID
La richiesta restituisce un oggetto JSON contenente un'istanza del job. I risultati dell'analisi si trovano all'interno della chiave "riskDetails"
, in un oggetto AnalyzeDataSourceRiskDetails
. Per ulteriori informazioni, consulta il riferimento API per la risorsa DlpJob
.
Passaggi successivi
- Scopri come calcolare il valore k-anonymity per un set di dati.
- Scopri come calcolare il valore k-map per un set di dati.
- Scopri come calcolare il valore della presenza di Δ per un set di dati.