Calcolo di δ-presence per un set di dati

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

La presenza delta (ASPMX) è una metrica che quantifica la probabilità che un individuo appartenga a un set di dati analizzato. Come per k-map, puoi stimare i valori di presenza di ASPMX utilizzando Cloud DLP, che utilizza un modello statistico per stimare il set di dati dell'attacco.

La presenza di ASPMX è in contrasto con gli altri metodi di analisi dei rischi in cui il set di dati dell'attacco è esplicitamente noto. A seconda del tipo di dati, Cloud DLP utilizza set di dati disponibili pubblicamente (ad esempio dal Censimento USA) o un modello statistico personalizzato (ad esempio una o più tabelle BigQuery specificate da te) oppure estrapola dalla distribuzione dei valori nel set di dati di input.

Questo argomento mostra come calcolare i valori di presenza ASPMX per un set di dati usando Cloud Data Loss Prevention. Per ulteriori informazioni sulla presenza di Analisi o della valutazione dei rischi in generale, consulta l'argomento del concetto di analisi dei rischi prima di continuare.

Prima di iniziare

Prima di continuare, assicurati di aver eseguito le seguenti operazioni:

  1. Accedi al tuo Account Google.
  2. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
  3. Vai al selettore progetti
  4. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud. Scopri come confermare che la fatturazione è abilitata per il tuo progetto.
  5. Abilita Cloud DLP.
  6. Abilita Cloud DLP

  7. Seleziona un set di dati BigQuery da analizzare. Cloud DLP stima la metrica di presenza ASPMX eseguendo la scansione di una tabella BigQuery.
  8. Determina i tipi di set di dati da utilizzare per modellare il set di dati dell'attacco. Per ulteriori informazioni, consulta la pagina di riferimento per l'oggetto DeltaPresenceEstimationConfig e i termini e le tecniche di analisi del rischio.

Metriche di presenza ASPMX di computing

Per calcolare una stima della presenza ASPMX usando Cloud DLP, invia una richiesta al seguente URL, dove PROJECT_ID indica il tuo identificatore del progetto:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

La richiesta contiene un oggetto RiskAnalysisJobConfig, che è composto da:

  • Un oggetto PrivacyMetric. Qui specifichi dove vuoi calcolare la presenza di ASPMX specificando un oggetto DeltaPresenceEstimationConfig contenente quanto segue:

    • quasiIds[]: obbligatorio. I campi (QuasiId oggetti) sono considerati quasi-identificatori da analizzare e usare per calcolare la presenza di ASPMX. Due colonne non possono avere lo stesso tag. Possono essere:

      • Un infoType: questo fa sì che Cloud DLP utilizzi il set di dati pubblico pertinente come modello statistico di popolazione, inclusi i codici postali degli Stati Uniti, i codici di regione, le età e i generi.
      • Un infoType personalizzato: un tag personalizzato in cui indichi una tabella ausiliaria (un oggetto AuxiliaryTable) contenente informazioni statistiche sui possibili valori di questa colonna.
      • Il tag inferred: se non è indicato alcun tag semantico, specifica inferred. Cloud DLP deduce il modello statistico dalla distribuzione dei valori nei dati di input.
    • regionCode: un codice regione ISO 3166-1 alpha-2 per Cloud DLP da utilizzare nella modellazione statistica. Questo valore è obbligatorio se nessuna colonna è codificata con un infoType specifico per la regione (ad esempio un codice postale statunitense) o un codice regione.

    • auxiliaryTables[]: tabelle ausiliarie (oggetti StatisticalTable) da utilizzare nell'analisi. Ogni tag personalizzato utilizzato per codificare una colonna con identificatore quasi (da quasiIds[]) deve apparire esattamente in una colonna di una tabella ausiliaria.

  • Un oggetto BigQueryTable. Specifica la tabella BigQuery da analizzare includendo tutti i seguenti elementi:

    • projectId: l'ID del progetto contenente la tabella.
    • datasetId: l'ID del set di dati della tabella.
    • tableId: il nome della tabella.
  • Un set di uno o più oggetti Action, che rappresentano le azioni da eseguire, nell'ordine specificato, al completamento del job. Ogni oggetto Action può contenere una delle seguenti azioni:

Visualizzare i risultati di un job di presenza ASPMX

Per recuperare i risultati del job di analisi del rischio di presenza ASPMX usando l'API REST, invia la seguente richiesta GET alla risorsa projects.dlpJobs. Sostituisci PROJECT_ID con il tuo ID progetto e JOB_ID con l'identificatore del job per cui vuoi ottenere risultati. L'ID job è stato restituito al momento dell'avvio del job e può essere recuperato elencando tutti i job.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

La richiesta restituisce un oggetto JSON contenente un'istanza del job. I risultati dell'analisi si trovano all'interno della chiave "riskDetails", in un oggetto AnalyzeDataSourceRiskDetails. Per ulteriori informazioni, consulta il riferimento API per la risorsa DlpJob.

Passaggi successivi

  • Scopri come calcolare il valore k-anonymity per un set di dati.
  • Scopri come calcolare il valore l-diversity per un set di dati.
  • Scopri come calcolare il valore k-map di un set di dati.