In questa pagina sono elencate e descritte tutte le metriche raccolte nei profili di dati.
Esistono tre tipi di profili di dati: profili di dati di progetto, profili di dati delle tabelle e profili di dati di colonna.
Profili di dati dei progetti
Ogni profilo dati di progetto include i seguenti campi. I valori per questi campi vengono aggregati in base alle risorse profilate all'interno del progetto.
Insight
I profili di dati dei progetti forniscono i seguenti insight:
- Rischio dei dati
- Livello di rischio associato ai dati allo stato attuale. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
- Riservatezza
- Punteggio che indica il livello di sensibilità per questo progetto. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio dei dati.
Metadati
I profili di dati del progetto forniscono i seguenti metadati:
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- ID progetto
- ID del progetto profilato.
- Nome della risorsa
- Nome completo del profilo dati.
- Stato
- Icona che indica lo stato dell'operazione di profilazione.
Profili dati della tabella
Ogni profilo dati della tabella include i seguenti campi:
Insight
I profili dei dati delle tabelle forniscono i seguenti insight:
- Rischio dei dati
- Livello di rischio associato ai dati allo stato attuale. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
- Riservatezza
- Punteggio che indica il livello di sensibilità per questa tabella. Per saperne di più, consulta la sezione Livelli di sensibilità e di rischio per i dati.
Metadati
I profili dei dati delle tabelle forniscono i seguenti metadati:
- Database
- Il database contenente la tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- ID set di dati
- ID del set di dati che contiene questa tabella.
- Crittografia
- Indica se la crittografia di questa tabella è gestita da Google o dalla tua organizzazione.
- Scadenza
- Facoltativo. L'ora di scadenza di questa tabella.
- Conteggio colonne in errore
- Il numero di colonne ignorate in questa tabella a causa di un errore.
- Ispeziona snapshot configurazione
- Istantanea del modello di ispezione utilizzato al momento della generazione del profilo. Per ulteriori informazioni, consulta Istantanee dei profili dati.
- Istanza
- L'istanza contenente la tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- Ultimo aggiornamento in BigQuery
- Data e ora dell'ultima modifica di questa tabella.
- ID progetto
- ID del progetto che contiene questa tabella.
- Pubblico
- Indica se la tabella è disponibile per tutti gli utenti o solo per determinati utenti.
- Etichette risorse
- Etichette che la tabella aveva al momento della generazione del profilo.
- Nome della risorsa
- Nome completo del profilo dati.
- Conteggio delle righe
- Numero di righe in questa tabella al momento della generazione del profilo.
- Conteggio colonne scansionate
- Il numero di colonne profilate in questa tabella.
- Account di servizio
- Numero di account di servizio con autorizzazioni IAM per accedere a questa tabella.
- Stato
- Indicazione che indica se la generazione del profilo è riuscita.
- ID tabella
- ID di questa tabella.
- Ora di creazione della tabella
- Data e ora di creazione della tabella.
- Dimensione tabella
- Le dimensioni di questa tabella al momento della generazione del profilo.
- Tipo
- Il tipo di rilevamento eseguito.
Profili dati delle colonne
Ogni profilo dati della colonna contiene i seguenti campi:
Insight
I profili dei dati delle colonne forniscono i seguenti insight:
- Rischio dei dati
- Livello di rischio associato ai dati allo stato attuale. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
- Riservatezza
- Punteggio che indica il livello di sensibilità per questa colonna. Per ulteriori informazioni, consulta la pagina relativa ai livelli di sensibilità e di rischio per i dati.
- infoType previsto
Se un singolo infoType integrato o personalizzato ha chiaramente prevalenza rispetto agli altri nella colonna, Sensitive Data Protection imposta questo campo su quel infoType. In caso contrario, questo campo non contiene alcun valore.
Per visualizzare un elenco di tutti gli infoType rilevati nella colonna, consulta il campo Altri infoType.
Sensitive Data Protection analizza solo gli infoType specificati nel modello di ispezione. Di conseguenza, solo questi infoType possono essere visualizzati nel campo InfoType previsto. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore di infoType
EMAIL_ADDRESS
nel modello di ispezione, questo campo non conterràEMAIL_ADDRESS
.In questo documento, consulta Altri infoType.
- Altri infoType
Gli infoType rilevati nella colonna non hanno un indicatore abbastanza forte da essere considerato l'infoType previsto della colonna. In questo documento, consulta la sezione infoType previsto.
Per i profili di dati generati dopo il 13 ottobre 2022, ogni infoType elencato in questo campo ha una prevalenza stimata. La prevalenza stimata è una percentuale approssimativa di righe con valore non null in cui è stato rilevato l'infoType.
Ad esempio, supponi di avere una colonna con le seguenti metriche:
- InfoType previsto:
FDA_CODE
- Altri infoType:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
In questo esempio, c'è un'indicazione forte del fatto che la colonna contiene codici della FDA. Sensitive Data Protection ha inoltre determinato che circa il 2% delle righe con valore non null nella colonna potrebbe contenere nomi di persone e l'1% potrebbe contenere indirizzi stradali.
Sensitive Data Protection analizza solo gli infoType specificati nel modello di ispezione. Di conseguenza, solo questi infoType possono essere visualizzati nel campo Altri infoType. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore di infoType
EMAIL_ADDRESS
nel modello di ispezione, questo campo non contieneEMAIL_ADDRESS
.- InfoType previsto:
- Proporzione di valori null stimata
Proporzione approssimativa di valori null in questa colonna, classificati come elevato, medio, basso o molto basso. Questo valore è alto se una grande proporzione di voci in questa colonna è null.
- Unicità stimata
Una stima di quanti dati in questa colonna sono univoci, classificati come alta, media o bassa. Un livello di univocità elevato suggerisce che la colonna contiene valori distinti. Una presenza elevata di valori univoci può indicare che la colonna contiene identificatori.
Un livello di univocità basso suggerisce che la colonna contiene molti valori comuni, come enum o valori booleani.
Se Sensitive Data Protection determina che la tabella non contiene un numero sufficiente di righe per calcolare questa metrica, questo valore viene lasciato vuoto.
- Punteggio testo libero
La probabilità che questa colonna contenga testo in formato libero. Un valore vicino a 1 indica che probabilmente la colonna contiene testo in formato libero o in linguaggio naturale. I valori possibili sono compresi tra 0 e 1.
Un punteggio elevato per il testo libero può aumentare i livelli di rischio e sensibilità dei dati di una colonna.
Metadati
I profili dei dati delle colonne forniscono i seguenti metadati:
- Database
- Il database contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- Tipo di dati
- Il tipo di dati relativi ai contenuti di questa colonna.
- ID set di dati
- ID del set di dati che contiene questa colonna della tabella.
- ID campo
- Nome della colonna.
- Istanza
- L'istanza contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- Località istanza
- Posizione dell'istanza contenente la colonna della tabella profilata. Questo campo si applica solo al rilevamento di Cloud SQL.
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- Tag di criteri
- Indica se alla colonna viene applicato un tag di criteri. Per informazioni sulle best practice per l'utilizzo dei tag di criteri, consulta Utilizzare i tag di criteri in BigQuery.
- ID progetto
- ID del progetto che contiene questa colonna della tabella.
- Nome della risorsa
- Nome completo del profilo dati.
- Stato
- Icona che indica lo stato dell'operazione di profilazione.
- ID tabella
- ID della tabella contenente questa colonna.