Introduzione alla governance dei dati in BigQuery
Questo documento fornisce un'introduzione alla governance dei dati di BigQuery e illustra come utilizzare le funzionalità di BigQuery per implementare e applicare le norme di governance dei dati di BigQuery. Per una panoramica più completa della governance dei dati in Google Cloud, consulta Che cos'è la governance dei dati?
La governance dei dati è la gestione della sicurezza e della qualità dei dati durante il loro ciclo di vita per garantire che l'accesso e l'accuratezza siano conformi ai criteri e alle normative dell'organizzazione. Queste priorità di governance dei dati possono essere suddivise in tre categorie:
Le sezioni seguenti definiscono queste categorie di governance dei dati, descrivono in che modo le funzionalità di BigQuery le supportano e consigliano i passaggi successivi.
Controllo degli accessi
La gestione dell'accesso ai dati è il processo di definizione, applicazione e monitoraggio delle regole e delle norme che regolano chi ha accesso ai dati. La gestione dell'accesso garantisce che i dati siano accessibili solo a chi è autorizzato. BigQuery fornisce le seguenti funzionalità per aiutarti con l'accesso ai dati:
- Identity and Access Management (IAM). IAM ti consente di controllare chi ha accesso alle tue risorse BigQuery, come progetti, set di dati, tabelle e visualizzazioni. Puoi concedere ruoli IAM a utenti, gruppi e account di servizio. Questi ruoli definiscono cosa possono fare con le tue risorse.
- Controlli di accesso a livello di colonna e controlli di accesso a livello di riga. I controlli di accesso a livello di riga e colonna ti consentono di limitare l'accesso a righe e colonne specifiche di una tabella in base agli attributi utente o ai valori dei dati. Questo controllo ti consente di implementare un accesso granulare per contribuire a proteggere i dati sensibili da accessi non autorizzati.
- Gestione del trasferimento dei dati. Controlli di servizio VPC ti consentono di creare perimetri attorno alle risorse Google Cloud e di controllarne l'accesso in base ai criteri della tua organizzazione.
- Log di controllo. Gli audit log forniscono un record dettagliato delle attività utente e degli eventi di sistema nella tua organizzazione. Questi log ti aiutano a applicare i criteri di governance dei dati e a identificare potenziali rischi per la sicurezza.
Passaggi successivi per controllo dell'accesso'accesso
La seguente tabella illustra i passaggi successivi che puoi svolgere per scoprire di più sulle funzionalità di controllo dell'accesso'accesso:
Livello di esperienza | Percorso di apprendimento |
---|---|
Nuovi utenti cloud |
|
Utenti esperti del cloud |
|
Gestione e controllo dei dati
La gestione dei dati contribuisce a proteggere i dati sensibili categorizzandoli, mascherandoli, oscurandoli o criptandoli in modo appropriato durante le query, il transito o l'archiviazione. Questo approccio migliora la protezione e l'organizzazione dei dati. BigQuery fornisce le seguenti funzionalità per aiutarti con la gestione dei dati:
- Masking dei dati. Il mascheramento dei dati consente di oscurare i dati sensibili in una tabella, continuando però a consentire agli utenti autorizzati di accedere ai dati circostanti. Può anche nascondere i dati che corrispondono a pattern di dati sensibili, proteggendoli dalla divulgazione accidentale.
- Crittografia. BigQuery cripta automaticamente tutti i dati inattivi e in transito, consentendoti al contempo di personalizzare le impostazioni di crittografia in base alle tue esigenze e ai tuoi requisiti specifici.
- Gestione dei metadati. La gestione dei metadati ti consente di taggare le risorse, il che ti aiuta a eseguire ricerche, organizzare e classificare i dati.
Passaggi successivi per la gestione dei dati
La tabella seguente illustra i passaggi successivi che puoi svolgere per scoprire di più sulle funzionalità di gestione dei dati:
Livello di esperienza | Percorso di apprendimento |
---|---|
Nuovi utenti cloud |
|
Utenti esperti del cloud |
|
Qualità dei dati
La gestione della qualità dei dati è il processo di tracciamento della derivazione dei dati e di verifica dell'adeguatezza dei dati ai tuoi standard di accuratezza, completezza e coerenza. BigQuery fornisce le seguenti funzionalità per aiutarti con la qualità dei dati:
- Rispetta la struttura dei dati. La derivazione dei dati consente di monitorare il flusso dei dati nel tempo, fornendo informazioni sull'origine dei dati, sulle relative variazioni nel tempo e sulla destinazione finale all'interno del sistema.
- Scansioni dei profili di dati. Le analisi del profilo dei dati ti consentono di analizzare le caratteristiche statistiche dei tuoi dati, ad esempio valori medi e univoci.
- Scansioni della qualità dei dati. Le analisi della qualità dei dati ti consentono di eseguire controlli dei dati, convalidare i dati in base a regole predefinite e risolvere i problemi relativi alla qualità dei dati.
Passaggi successivi per la qualità dei dati
La tabella seguente illustra i passaggi successivi che puoi svolgere per scoprire di più sulle funzionalità di accesso alla qualità dei dati:
Livello di esperienza | Percorso di apprendimento |
---|---|
Nuovi utenti cloud |
|
Utenti esperti del cloud |
|
Passaggi successivi
- Scopri di più sull'autenticazione in Google.
- Scopri di più sull'eliminazione dei dati su Google Cloud.
- Scopri di più sulle best practice per l'IAM.
- Scopri la gerarchia delle risorse su Google Cloud.
- Scopri di più su IAM su Google Cloud.