Riferimento per le metriche

In questa pagina sono elencate e descritte tutte le metriche raccolte nei profili di dati.

Esistono tre tipi di profili di dati: profili di dati di progetto, profili di dati delle tabelle e profili di dati di colonna.

Profili di dati dei progetti

Ogni profilo dati di progetto include i seguenti campi. I valori per questi campi vengono aggregati in base alle risorse profilate all'interno del progetto.

Insight

I profili di dati dei progetti forniscono i seguenti insight:

Rischio dei dati
Livello di rischio associato ai dati allo stato attuale. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
Riservatezza
Punteggio che indica il livello di sensibilità per questo progetto. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio dei dati.

Metadati

I profili di dati del progetto forniscono i seguenti metadati:

Ultimo profilo generato
Data e ora dell'ultima generazione del profilo.
ID progetto
ID del progetto profilato.
Nome della risorsa
Nome completo del profilo dati.
Stato
Icona che indica lo stato dell'operazione di profilazione.

Profili dati della tabella

Ogni profilo dati della tabella include i seguenti campi:

Insight

I profili dei dati delle tabelle forniscono i seguenti insight:

Rischio dei dati
Livello di rischio associato ai dati allo stato attuale. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
Riservatezza
Punteggio che indica il livello di sensibilità per questa tabella. Per saperne di più, consulta la sezione Livelli di sensibilità e di rischio per i dati.

Metadati

I profili dei dati delle tabelle forniscono i seguenti metadati:

Database
Il database contenente la tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
ID set di dati
ID del set di dati che contiene questa tabella.
Crittografia
Indica se la crittografia di questa tabella è gestita da Google o dalla tua organizzazione.
Scadenza
Facoltativo. L'ora di scadenza di questa tabella.
Conteggio colonne in errore
Il numero di colonne ignorate in questa tabella a causa di un errore.
Ispeziona snapshot configurazione
Istantanea del modello di ispezione utilizzato al momento della generazione del profilo. Per ulteriori informazioni, consulta Istantanee dei profili dati.
Istanza
L'istanza contenente la tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
Ultimo profilo generato
Data e ora dell'ultima generazione del profilo.
Ultimo aggiornamento in BigQuery
Data e ora dell'ultima modifica di questa tabella.
ID progetto
ID del progetto che contiene questa tabella.
Pubblico
Indica se la tabella è disponibile per tutti gli utenti o solo per determinati utenti.
Etichette risorse
Etichette che la tabella aveva al momento della generazione del profilo.
Nome della risorsa
Nome completo del profilo dati.
Conteggio delle righe
Numero di righe in questa tabella al momento della generazione del profilo.
Conteggio colonne scansionate
Il numero di colonne profilate in questa tabella.
Account di servizio
Numero di account di servizio con autorizzazioni IAM per accedere a questa tabella.
Stato
Indicazione che indica se la generazione del profilo è riuscita.
ID tabella
ID di questa tabella.
Ora di creazione della tabella
Data e ora di creazione della tabella.
Dimensione tabella
Le dimensioni di questa tabella al momento della generazione del profilo.
Tipo
Il tipo di rilevamento eseguito.

Profili dati delle colonne

Ogni profilo dati della colonna contiene i seguenti campi:

Insight

I profili dei dati delle colonne forniscono i seguenti insight:

Rischio dei dati
Livello di rischio associato ai dati allo stato attuale. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
Riservatezza
Punteggio che indica il livello di sensibilità per questa colonna. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
infoType previsto

Se un singolo infoType integrato o personalizzato ha chiaramente prevalenza rispetto agli altri nella colonna, Sensitive Data Protection imposta questo campo su quel infoType. In caso contrario, questo campo non contiene alcun valore.

Per visualizzare un elenco di tutti gli infoType rilevati nella colonna, consulta il campo Altri infoType.

Sensitive Data Protection analizza solo gli infoType specificati nel modello di ispezione. Di conseguenza, solo questi infoType possono essere visualizzati nel campo InfoType previsto. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore di infoType EMAIL_ADDRESS nel modello di ispezione, questo campo non conterrà EMAIL_ADDRESS.

In questo documento, consulta Altri infoType.

Altri infoType

Gli infoType rilevati nella colonna non hanno un indicatore abbastanza forte da essere considerato l'infoType previsto della colonna. In questo documento, consulta la sezione infoType previsto.

Per i profili di dati generati dopo il 13 ottobre 2022, ogni infoType elencato in questo campo ha una prevalenza stimata. La prevalenza stimata è una percentuale approssimativa di righe con valore non null in cui è stato rilevato l'infoType.

Ad esempio, supponi di avere una colonna con le seguenti metriche:

  • InfoType previsto: FDA_CODE
  • Altri infoType: PERSON_NAME (2%), STREET_ADDRESS (1%)

In questo esempio, c'è un'indicazione forte del fatto che la colonna contiene codici della FDA. Sensitive Data Protection ha inoltre determinato che circa il 2% delle righe con valore non null nella colonna potrebbe contenere nomi di persone e l'1% potrebbe contenere indirizzi stradali.

Sensitive Data Protection analizza solo gli infoType specificati nel modello di ispezione. Di conseguenza, solo questi infoType possono essere visualizzati nel campo Altri infoType. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore di infoType EMAIL_ADDRESS nel modello di ispezione, questo campo non contiene EMAIL_ADDRESS.

Proporzione di valori null stimata

Proporzione approssimativa di valori null in questa colonna, classificati come elevato, medio, basso o molto basso. Questo valore è alto se una grande proporzione di voci in questa colonna è null.

Unicità stimata

Una stima di quanti dati in questa colonna sono univoci, classificati come alta, media o bassa. Un livello di univocità elevato suggerisce che la colonna contiene valori distinti. Una presenza elevata di valori univoci può indicare che la colonna contiene identificatori.

Un livello di univocità basso suggerisce che la colonna contiene molti valori comuni, come enum o valori booleani.

Se Sensitive Data Protection determina che la tabella non contiene un numero sufficiente di righe per calcolare questa metrica, questo valore viene lasciato vuoto.

Punteggio testo libero

La probabilità che questa colonna contenga testo in formato libero. Un valore vicino a 1 indica che probabilmente la colonna contiene testo in formato libero o in linguaggio naturale. I valori possibili sono compresi tra 0 e 1.

Un punteggio elevato per il testo libero può aumentare i livelli di rischio e sensibilità dei dati di una colonna.

Metadati

I profili dei dati delle colonne forniscono i seguenti metadati:

Database
Il database contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
Tipo di dati
Il tipo di dati relativi ai contenuti di questa colonna.
ID set di dati
ID del set di dati che contiene questa colonna della tabella.
ID campo
Nome della colonna.
Istanza
L'istanza contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
Località istanza
Posizione dell'istanza contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
Ultimo profilo generato
Data e ora dell'ultima generazione del profilo.
Tag di criteri
Indica se alla colonna viene applicato un tag di criteri. Per informazioni sulle best practice per l'utilizzo dei tag di criteri, consulta Utilizzare i tag di criteri in BigQuery.
ID progetto
ID del progetto che contiene questa colonna della tabella.
Nome della risorsa
Nome completo del profilo dati.
Stato
Icona che indica lo stato dell'operazione di profilazione.
ID tabella
ID della tabella contenente questa colonna.