Riferimento per le metriche

Questa pagina elenca e descrive tutte le metriche raccolte nei profili dei dati.

Esistono tre tipi di profili di dati: profili di dati di progetto, profili di dati di tabella e profili di dati di colonna.

Profili di dati di progetto

Ogni profilo dei dati del progetto contiene i seguenti campi. I valori di questi campi vengono aggregati in base alle risorse profilate all'interno del progetto.

Approfondimenti

I profili dei dati di progetto forniscono le seguenti informazioni:

Rischio dei dati
Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
Sensibilità
Punteggio che indica il livello di sensibilità per questo progetto. Per ulteriori informazioni, consulta Livelli di rischio dei dati e sensibilità.

Metadati

I profili dati di progetto forniscono i seguenti metadati:

Ultimo profilo generato
Data e ora dell'ultima generazione del profilo.
ID progetto
ID del progetto di cui è stato creato il profilo.
Nome risorsa
Nome completo del profilo dati.
Stato
Icona che indica lo stato dell'operazione di profilazione.

Profili dati tabella

Ogni profilo dati della tabella contiene i seguenti campi:

Approfondimenti

I profili dati tabella forniscono le seguenti informazioni:

Rischio dei dati
Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
Sensibilità
Punteggio che indica il livello di sensibilità per questa tabella. Per ulteriori informazioni, consulta Livelli di rischio dei dati e sensibilità.

Metadati

I profili dei dati delle tabelle forniscono i seguenti metadati:

Database
Il database contenente la tabella di cui è stato eseguito il profilo. Questo campo si applica solo alla ricerca di Cloud SQL.
ID set di dati
ID del set di dati che contiene questa tabella.
Crittografia
Indica se la crittografia di questa tabella è gestita da Google o dalla tua organizzazione.
Scadenza
Facoltativo. L'ora di scadenza della tabella.
Conteggio colonne in errore
Il numero di colonne ignorate in questa tabella a causa di un errore.
Ispeziona snapshot configurazione
Istantanea del modello di ispezione utilizzato durante la generazione del profilo. Per ulteriori informazioni, consulta Snapshot dei profili dei dati.
Istanza
L'istanza contenente la tabella di cui è stato eseguito il profiling. Questo campo si applica solo alla ricerca di Cloud SQL.
Ultimo profilo generato
Data e ora dell'ultima generazione del profilo.
Ultimo aggiornamento in BigQuery
Data e ora dell'ultima modifica della tabella.
ID progetto
ID del progetto che contiene questa tabella.
Pubblico

Indica se questa tabella è disponibile per tutti gli utenti o limitata a determinati utenti.

Etichette risorse

Etichette della tabella al momento della generazione del profilo.

Tag di risorse

Tag della tabella al momento della generazione del profilo.

Nome risorsa

Nome completo del profilo dei dati.

Conteggio delle righe

Numero di righe in questa tabella al momento della generazione del profilo.

Conteggio colonne scansionate

Il numero di colonne profilate in questa tabella.

Service account

Numero di account di servizio con autorizzazioni IAM per accedere a questa tabella.

Stato

Indica se la generazione del profilo è riuscita.

ID tabella

ID di questa tabella.

Ora di creazione della tabella

Data e ora di creazione della tabella.

Dimensione tabella

Le dimensioni di questa tabella al momento della generazione del profilo.

Tipo

Il tipo di rilevamento eseguito.

Profili dei dati delle colonne

Ogni profilo dei dati delle colonne contiene i seguenti campi:

Approfondimenti

I profili dei dati delle colonne forniscono le seguenti informazioni:

Rischio dei dati
Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
Sensibilità
Punteggio che indica il livello di sensibilità per questa colonna. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
infoType previsto

Se un singolo infoType integrato o personalizzato ha una chiara prevalenza rispetto agli altri nella colonna, Sensitive Data Protection imposta questo campo su quel infoType. In caso contrario, questo campo non ha valore.

Per visualizzare un elenco di tutti gli infoType rilevati nella colonna, consulta il campo Altri infoType.

Sensitive Data Protection cerca solo gli infoType specificati nel modello di ispezione. Pertanto, solo questi infoType possono essere visualizzati nel campo InfoType previsto. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore infoType EMAIL_ADDRESS nel modello di ispezione, questo campo non contiene EMAIL_ADDRESS.

Se i dati della colonna corrispondono prevalentemente a diversi infoType strettamente correlati che appartengono alla stessa categoria generale, la funzionalità Protezione dei dati sensibili imposta questo campo sull'infoType più generale. Ad esempio, se la colonna contiene prevalentemente una combinazione di infoType PASSPORT, AUSTRALIA_PASSPORT e CANADA_PASSPORT, il campo infoType previsto è impostato su PASSPORT. Il campo Altri infoType mostra gli infoType più specifici e la loro prevalenza stimata.

Altri infoType

Gli infoType rilevati nella colonna che non hanno un indicatore sufficientemente forte per essere considerati infoType previsti della colonna. In questo documento, consulta infoType previsto.

Per i profili di dati generati dopo il 13 ottobre 2022, ogni infoType elencato in questo campo ha una prevalenza stimata. La prevalenza stimata è una percentuale approssimativa di righe con valore non null in cui è stato rilevato l'infoType.

Ad esempio, supponiamo di avere una colonna con le seguenti metriche:

  • infoType previsto: FDA_CODE
  • Altri infoType: PERSON_NAME (2%), STREET_ADDRESS (1%)

In questo esempio, è molto probabile che la colonna contenga codici FDA. La protezione dei dati sensibili ha inoltre stabilito che circa il 2% delle righe non nulle della colonna potrebbe contenere nomi di persone e l'1% potrebbe contenere indirizzi.

Sensitive Data Protection cerca solo gli infoType specificati nel modello di ispezione. Pertanto, solo questi infoType possono essere visualizzati nel campo Altri infoType. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore infoType EMAIL_ADDRESS nel modello di ispezione, questo campo non contiene EMAIL_ADDRESS.

Proporzione di valori null stimata

Proporzione approssimativa di valori null in questa colonna, classificata come alta, media, bassa o molto bassa. Questo valore è elevato se una grande proporzione di voci in questa colonna è null.

Unicità stimata

Una stima della quantità di dati univoci in questa colonna, classificata come elevata, media o bassa. Un livello di univocità elevato indica che la colonna contiene valori distinti. Un'elevata presenza di valori univoci può indicare che la colonna contiene identificatori.

Un livello di univocità basso suggerisce che la colonna contiene molti valori comuni, come enumerazioni o valori booleani.

Se la funzionalità Protezione dei dati sensibili determina che non ci sono righe sufficienti nella tabella per calcolare questa metrica, questo valore è vuoto.

Punteggio testo libero

La probabilità che questa colonna contenga testo in formato libero. Un valore vicino a 1 indica che la colonna è probabile che contenga testo in formato libero o in linguaggio naturale. I valori possibili vanno da 0 a 1.

Un punteggio elevato per il testo libero può aumentare i livelli di rischio e sensibilità dei dati di una colonna.

Metadati

I profili dati delle colonne forniscono i seguenti metadati:

Database
Il database contenente la colonna della tabella di cui è stato eseguito il profilo. Questo campo si applica solo al ricerca di Cloud SQL.
Tipo di dati
Il tipo di dati dei contenuti di questa colonna.
ID set di dati
ID del set di dati che contiene questa colonna della tabella.
ID campo
Nome della colonna.
Istanza
L'istanza contenente la colonna della tabella di cui è stato eseguito il profiling. Questo campo si applica solo al ricerca di Cloud SQL.
Località istanza
Posizione dell'istanza contenente la colonna della tabella di cui è stato eseguito il profiling. Questo campo si applica solo al rilevamento di Cloud SQL.
Ultimo profilo generato
Data e ora dell'ultima generazione del profilo.
Tag di criteri
Indica se alla colonna è applicato un tag di criteri. Per informazioni sulle best practice per l'utilizzo dei tag di criteri, consulta Utilizzare i tag di criteri in BigQuery.
ID progetto
ID del progetto contenente questa colonna della tabella.
Nome risorsa
Nome completo del profilo dati.
Stato
Icona che indica lo stato dell'operazione di profilazione.
ID tabella
ID della tabella contenente questa colonna.

Profili dati dell'archivio file

Sensitive Data Protection utilizza il termine file store per fare riferimento a un bucket di archiviazione file.

Ogni profilo dati dell'archivio file contiene i seguenti campi.

Approfondimenti

I profili dati dell'archivio file forniscono le seguenti informazioni:

Rischio dei dati
Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
Cluster di file
Fornisce un riepilogo per ogni cluster di file rilevato durante il profiling di questo repository. Per ulteriori informazioni su ogni riepilogo, consulta la sezione Riepiloghi dei cluster di file in questa pagina.
Sensibilità
Punteggio che indica il livello di sensibilità per questo spazio di archiviazione file. Per ulteriori informazioni, consulta Livelli di rischio dei dati e sensibilità.

Metadati

I profili dati dell'archivio file forniscono i seguenti metadati:

Località di archiviazione dei dati

Se hai creato il profilo di un bucket Cloud Storage a due regioni, questo campo elenca le due regioni.

Se hai generato il profilo di un bucket Amazon S3, questo valore è la regione AWS in cui è archiviato il bucket.

Crittografia

Se la crittografia di questo repository è gestita da Google o dalla tua organizzazione.

Tipo di archivio file

Il tipo di dati di cui è stato creato il profilo: dati Cloud Storage o dati Amazon S3.

Percorso archivio file

Il nome dell'archivio file.

Ispeziona snapshot configurazione

Istantanea del modello di ispezione utilizzato durante la generazione del profilo. Per ulteriori informazioni, consulta Snapshot dei profili dei dati.

Tipo di posizione

Tipo di posizione in cui è archiviato il repository di file: region, dual-region o multi-region.

Data/ora creazione profilo

Data e ora in cui il profilo è stato creato per la prima volta.

Ultima generazione del profilo

Data e ora dell'ultima generazione del profilo.

ID principale

La risorsa proprietaria dei dati sottoposti a profilazione.

  • Se il profilo dei dati è per una risorsa Google Cloud, si tratta dell'ID del progetto che contiene i dati.
  • Se il profilo dei dati è per un bucket Amazon S3, si tratta dell'ID dell'account AWS che contiene il bucket.
Pubblico

Indica se questo archivio file è disponibile per tutti gli utenti o limitato a determinati utenti.

Etichette risorse

Etichette dell'archivio file al momento della generazione del profilo.

Tag di risorse

Tag dell'archivio file al momento della generazione del profilo.

Località della risorsa

Regione o più regioni che contengono l'archivio file.

Se hai creato il profilo di un bucket Cloud Storage con doppia regione, questo valore dipende dal fatto che il bucket sia archiviato in una doppia regione predefinita:

  • Per le regioni doppie predefinite, Sensitive Data Protection imposta questo valore sul nome della regione doppia predefinita.
  • Per le regioni doppie standard, Sensitive Data Protection imposta questo valore sulla regione multipla che contiene le regioni doppie. Per informazioni su come le regioni vengono mappate alle regioni multiple, consulta Regioni doppie.
Nome risorsa

Nome completo del profilo dei dati.

Stato

Indica se la generazione del profilo è riuscita.

Riepiloghi dei cluster di file

Quando viene generato un profilo dati dell'archivio file, i file vengono raggruppati in cluster. Sensitive Data Protection fornisce un riepilogo per ogni cluster di file.

Ogni riepilogo del cluster di file contiene i seguenti campi:

Rischio dei dati
Livello di rischio associato ai dati in questo cluster di file. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
Errori
Eventuali errori rilevati durante la generazione del profilo dati del file store.
Estensioni dei file analizzate
Elenco dei tipi di file rilevati e analizzati per generare il profilo dei dati dell'archivio file.
Estensioni dei file rilevate
Elenco dei tipi di file rilevati, ma non necessariamente analizzati.
InfoType
Elenco di infoType integrati e personalizzati che sono stati rilevati in questo cluster di file.
Sensibilità
Punteggio che indica il livello di sensibilità per questo cluster di file. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
Tipo
Indica la categoria dei file in questo cluster. Per ulteriori informazioni su tutti i cluster di file supportati, consulta Cluster di file.