Questa pagina elenca e descrive tutte le metriche raccolte nei profili dei dati.
Esistono tre tipi di profili di dati: profili di dati del progetto, profili di dati della tabella e profili di dati della colonna.
Profili di dati del progetto
Ogni profilo dei dati del progetto ha i seguenti campi. I valori di questi campi vengono aggregati in base alle risorse profilate all'interno del progetto.
Approfondimenti
I profili dati del progetto forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, vedi Livelli di rischio dei dati e sensibilità.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questo progetto. Per saperne di più, vedi Livelli di rischio dei dati e sensibilità.
Metadati
I profili dati di progetto forniscono i seguenti metadati:
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- ID progetto
- ID del progetto di cui è stato creato il profilo.
- Nome risorsa
- Nome completo del profilo dei dati.
- Stato
- Icona che indica lo stato dell'operazione di profilazione.
Profili dati tabella
Ogni profilo dei dati della tabella ha i seguenti campi:
Approfondimenti
I profili dati tabella forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, vedi Livelli di rischio dei dati e sensibilità.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questa tabella. Per saperne di più, vedi Livelli di rischio dei dati e sensibilità.
Metadati
I profili dati delle tabelle forniscono i seguenti metadati:
- Database
- Il database contenente la tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- ID set di dati
- ID del set di dati che contiene questa tabella.
- Crittografia
- Se la crittografia per questa tabella è gestita da Google o dalla tua organizzazione.
- Scadenza
- Facoltativo. L'ora di scadenza di questa tabella.
- Conteggio colonne in errore
- Il numero di colonne ignorate in questa tabella a causa di un errore.
- Ispeziona snapshot configurazione
- Snapshot del modello di ispezione utilizzato al momento della generazione del profilo. Per saperne di più, consulta la sezione Snapshot dei profili dei dati.
- Istanza
- L'istanza contenente la tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- Ultimo aggiornamento in BigQuery
- Data e ora dell'ultima modifica della tabella.
- ID progetto
- ID del progetto che contiene questa tabella.
- Pubblico
Indica se questa tabella è disponibile per tutti gli utenti o limitata a determinati utenti.
- Etichette risorse
Etichette che la tabella aveva al momento della generazione del profilo.
- Tag di risorse
Tag che la tabella aveva al momento della generazione del profilo.
- Nome risorsa
Nome completo del profilo dei dati.
- Conteggio delle righe
Numero di righe in questa tabella al momento della generazione del profilo.
- Conteggio colonne scansionate
Il numero di colonne profilate in questa tabella.
- Service account
Numero di service account con autorizzazioni IAM per accedere a questa tabella.
- Stato
Indica se il profilo è stato generato correttamente.
- ID tabella
L'ID di questa tabella.
- Ora di creazione della tabella
Data e ora in cui è stata creata la tabella.
- Dimensione tabella
Le dimensioni di questa tabella al momento della generazione del profilo.
- Tipo
Il tipo di scoperta eseguita.
Profili dei dati delle colonne
Ogni profilo dei dati della colonna ha i seguenti campi:
Approfondimenti
I profili dei dati delle colonne forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, vedi Livelli di rischio dei dati e sensibilità.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questa colonna. Per saperne di più, consulta Livelli di rischio dei dati e sensibilità.
- infoType previsto
Se un singolo infoType integrato o personalizzato ha una chiara prevalenza rispetto agli altri nella colonna, Sensitive Data Protection imposta questo campo su quel tipo di infoType. In caso contrario, questo campo non ha alcun valore.
Per visualizzare un elenco di tutti gli infoType rilevati nella colonna, consulta il campo Altri infoType.
Sensitive Data Protection esegue la scansione solo degli infoType specificati nel modello di ispezione. Pertanto, solo questi infoType possono essere visualizzati nel campo infoType previsto. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore infoType
EMAIL_ADDRESS
nel modello di ispezione, questo campo non contieneEMAIL_ADDRESS
.Se i dati della colonna corrispondono principalmente a diversi infoType strettamente correlati che appartengono alla stessa categoria generale, Sensitive Data Protection imposta questo campo sull'infoType più generale. Ad esempio, se la colonna contiene prevalentemente un mix di infoType
PASSPORT
,AUSTRALIA_PASSPORT
eCANADA_PASSPORT
, il campo infoType previsto è impostato suPASSPORT
. Il campo Altri infoType mostra gli infoType più specifici e la loro prevalenza stimata.- Altri infoType
Gli infoType rilevati nella colonna che non hanno un segnale sufficientemente forte da essere considerati l'infoType previsto della colonna. In questo documento, consulta la sezione infoType previsto.
Per i profili di dati generati dopo il 13 ottobre 2022, ogni infoType elencato in questo campo ha una prevalenza stimata. La prevalenza stimata è una percentuale approssimativa di righe con valore non null in cui è stato rilevato l'infoType.
Ad esempio, supponiamo di avere una colonna con le seguenti metriche:
- infoType previsto:
FDA_CODE
- Altri infoType:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
In questo esempio, è presente un'indicazione chiara che la colonna contiene codici FDA. La protezione dei dati sensibili ha anche stabilito che circa il 2% delle righe non nulle nella colonna potrebbe contenere nomi di persone e l'1% potrebbe contenere indirizzi.
Sensitive Data Protection esegue la scansione solo degli infoType specificati nel modello di ispezione. Pertanto, solo questi infoType possono essere visualizzati nel campo Altri infoType. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore infoType
EMAIL_ADDRESS
nel modello di ispezione, questo campo non contieneEMAIL_ADDRESS
.- infoType previsto:
- Proporzione di valori null stimata
Proporzione approssimativa di valori null in questa colonna, classificata come alta, media, bassa o molto bassa. Questo valore è elevato se una grande proporzione di voci in questa colonna è null.
- Unicità stimata
Una stima della quantità di dati univoci in questa colonna, classificati come alta, media o bassa. Un livello di univocità elevato indica che la colonna contiene valori distinti. Un'elevata presenza di valori univoci può indicare che la colonna contiene identificatori.
Un livello di univocità basso suggerisce che la colonna contiene molti valori comuni, come enumerazioni o valori booleani.
Se Sensitive Data Protection determina che non ci sono righe sufficienti nella tabella per calcolare questa metrica, questo valore è vuoto.
- Punteggio testo libero
La probabilità che questa colonna contenga testo in formato libero. Un valore vicino a 1 indica che la colonna probabilmente contiene testo in formato libero o in linguaggio naturale. I valori possibili vanno da 0 a 1.
Un punteggio elevato di testo libero può aumentare i livelli di rischio e sensibilità dei dati di una colonna.
Metadati
I profili dati delle colonne forniscono i seguenti metadati:
- Database
- Il database contenente la colonna della tabella profilata. Questo campo si applica solo all'individuazione di Cloud SQL.
- Tipo di dati
- Il tipo di dati dei contenuti di questa colonna.
- ID set di dati
- ID del set di dati che contiene questa colonna della tabella.
- ID campo
- Nome della colonna.
- Istanza
- L'istanza contenente la colonna della tabella profilata. Questo campo si applica solo all'individuazione di Cloud SQL.
- Località istanza
- Posizione dell'istanza contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- Tag di criteri
- Indica se alla colonna è applicato un tag di criteri. Per informazioni sulle best practice per l'utilizzo dei tag di criteri, consulta Utilizzo dei tag di criteri in BigQuery.
- ID progetto
- ID del progetto contenente questa colonna della tabella.
- Nome risorsa
- Nome completo del profilo dei dati.
- Stato
- Icona che indica lo stato dell'operazione di profilazione.
- ID tabella
- ID della tabella che contiene questa colonna.
Profili dati archivio file
Sensitive Data Protection utilizza il termine archivio file per fare riferimento a un bucket o un contenitore di archiviazione di file.
Ogni profilo dati archivio file ha i seguenti campi.
Approfondimenti
I profili dati archivio file forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, vedi Livelli di rischio dei dati e sensibilità.
- Cluster di file
- Fornisce un riepilogo per ogni cluster di file rilevato durante la profilazione di questo archivio file. Per saperne di più su ogni riepilogo, consulta la sezione Riepiloghi dei cluster di file in questa pagina.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questo archivio file. Per saperne di più, vedi Livelli di rischio dei dati e sensibilità.
Metadati
I profili dati archivio file forniscono i seguenti metadati:
- Località di archiviazione dei dati
Se hai profilato un bucket Cloud Storage a doppia regione, questo campo elenca le due regioni.
Se hai profilato un archivio file di un altro cloud provider, questo valore è la regione in cui il cloud provider archivia l'archivio file.
- Crittografia
Se la crittografia per questo archivio file è gestita da Google o dalla tua organizzazione.
- Tipo di archivio file
L'origine dei dati di cui è stato creato il profilo: Cloud Storage, Amazon S3 o Azure Blob Storage.
- Percorso archivio file
Il nome dell'archivio di file.
- Ispeziona snapshot configurazione
Snapshot del modello di ispezione utilizzato al momento della generazione del profilo. Per saperne di più, consulta la sezione Snapshot dei profili dei dati.
- Tipo di località
Tipo di posizione in cui è archiviato l'archivio file:
region
,dual-region
omulti-region
.- Data/ora creazione profilo
Data e ora in cui è stato creato il profilo per la prima volta.
- Ultima generazione del profilo
Data e ora dell'ultima generazione del profilo.
- ID principale
La risorsa proprietaria dei dati profilati.
- Se il profilo dei dati riguarda una risorsa Google Cloud , questo è l'ID del progetto che contiene i dati.
- Se il profilo di dati riguarda un bucket Amazon S3, questo è l'ID dell'account AWS che contiene il bucket.
- Se il profilo di dati riguarda un container Azure Blob Storage, questo è l'ID dell'abbonamento Azure che contiene il container.
- Pubblico
Indica se questo archivio file è disponibile per tutti gli utenti o limitato a determinati utenti.
- Etichette risorse
Etichette che l'archivio file aveva al momento della generazione del profilo.
- Tag di risorse
Tag che l'archivio file aveva al momento della generazione del profilo.
- Località della risorsa
La regione o le regioni che contengono l'archivio file.
Se hai profilato un bucket Cloud Storage a due regioni, questo valore dipende dal fatto che il bucket sia archiviato in una doppia regione predefinita:
- Per le doppie regioni predefinite, Sensitive Data Protection imposta questo valore sul nome della doppia regione predefinita.
- Per le doppie regioni standard, Sensitive Data Protection imposta questo valore sulla multiregione che contiene le doppie regioni. Per informazioni su come le regioni vengono mappate alle multiregioni, consulta Regioni doppie.
- Nome risorsa
Nome completo del profilo dei dati.
- Stato
Indica se il profilo è stato generato correttamente.
Riepiloghi dei cluster di file
Quando viene generato un profilo dati archivio file, i file vengono raggruppati in cluster di file. Sensitive Data Protection fornisce un riepilogo per ogni cluster di file.
Ogni riepilogo del cluster di file ha i seguenti campi:
- Rischio dei dati
- Livello di rischio associato ai dati in questo cluster di file. Per ulteriori informazioni, vedi Livelli di rischio dei dati e sensibilità.
- Errori
- Eventuali errori rilevati durante la generazione del profilo dati dell'archivio file.
- Estensioni dei file analizzate
- Elenco dei tipi di file rilevati e analizzati per generare il profilo dei dati dell'archivio file.
- Estensioni dei file visualizzate
- Elenco dei tipi di file rilevati, ma non necessariamente analizzati.
- InfoType
- Elenco degli infoType integrati e personalizzati rilevati in questo cluster di file.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questo cluster di file. Per ulteriori informazioni, vedi Livelli di rischio dei dati e sensibilità.
- Tipo
Indica la categoria dei file in questo cluster. Per ulteriori informazioni su tutti i cluster di file supportati, consulta Cluster di file supportati nelle operazioni di rilevamento.