Classificazione, oscuramento e anonimizzazione

Sensitive Data Protection ti aiuta a comprendere, gestire e proteggere i dati sensibili. Con la protezione dei dati sensibili, puoi classificare e oscurare facilmente i dati sensibili contenuti in immagini e contenuti basati su testo, inclusi i contenuti archiviati nei repository di Google Cloud Storage.

Classificazione del testo

Dato il seguente input di testo:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

L'output è un elenco di risultati, organizzati nelle seguenti categorie:

Un esempio di output è riportato nella tabella seguente.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

Oscuramento automatico del testo

L'oscuramento automatico produce un output con le corrispondenze dei dati sensibili rimosse invece di fornire un elenco di risultati.

Esempio di input di oscuramento dell'automazione:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

Esempio di output che utilizza un segnaposto "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

Classificazione delle immagini

La funzionalità Protezione dei dati sensibili utilizza la tecnologia di riconoscimento ottico dei caratteri (OCR) per riconoscere il testo prima della classificazione. Analogamente alla classificazione del testo, restituisce i risultati, ma aggiunge anche una riquadro di delimitazione dove è stato trovato il testo.

Classificazione dello spazio di archiviazione

La classificazione dello spazio di archiviazione esegue la scansione dei dati archiviati in Cloud Storage, Firestore in modalità Datastore (Datastore) e BigQuery. Anziché eseguire lo streaming dei dati in Protezione dati sensibili, specifica nella richiesta la posizione di archiviazione del bucket Cloud Storage, del tipo di Datastore o della tabella BigQuery che vuoi che Protezione dati sensibili esamini.

Durante la scansione dei file nelle posizioni di Cloud Storage, la funzionalità Protezione dei dati sensibili supporta la scansione di file di tipo binario, di testo, immagine, Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF e Apache Avro. Un elenco delle estensioni dei file per i tipi di file in Cloud Storage che Sensitive Data Protection può analizzare è disponibile nella pagina di riferimento dell'API per FileType. I file di tipi non riconosciuti vengono analizzati come file binari.

I risultati della scansione possono essere salvati in una nuova tabella BigQuery o pubblicati in un argomento Pub/Sub. Da qui, puoi utilizzare gli strumenti BigQuery integrati per eseguire analisi SQL avanzate o strumenti come Looker Studio per generare report.

Per ulteriori informazioni sulla scansione dei repository di archiviazione per rilevare dati sensibili utilizzando la funzionalità Protezione dei dati sensibili, consulta Ispezione dello spazio di archiviazione e dei database per l'individuazione di dati sensibili.

Per ulteriori informazioni sulla visualizzazione dei risultati della scansione utilizzando altri strumenti Google Cloud, consulta Analisi e generazione di report sui risultati di Sensitive Data Protection.

Passaggi successivi