Introduzione alla governance dei dati in BigQuery
Questo documento fornisce un'introduzione alla governance dei dati di BigQuery e illustra come utilizzare le funzionalità di BigQuery per implementare e applicare i criteri di governance dei dati di BigQuery. Per una panoramica più completa della governance dei dati in Google Cloud, consulta Che cos'è la governance dei dati?
La governance dei dati è la gestione della sicurezza e della qualità dei dati durante il loro ciclo di vita per garantire che l'accesso e l'accuratezza siano conformi ai criteri e alle normative dell'organizzazione. Queste priorità di governance dei dati possono essere suddivise in tre categorie:
Le sezioni seguenti definiscono queste categorie di governance dei dati, descrivono in che modo le funzionalità di BigQuery le supportano e consigliano i passaggi successivi.
Controllo degli accessi
La gestione dell'accesso ai dati è il processo di definizione, applicazione e monitoraggio delle regole e delle norme che regolano chi ha accesso ai dati. La gestione dell'accesso garantisce che i dati siano accessibili solo a chi è autorizzato. BigQuery fornisce le seguenti funzionalità per aiutarti con l'accesso ai dati:
- Identity and Access Management (IAM). IAM ti consente di controllare chi ha accesso alle tue risorse BigQuery, come progetti, set di dati, tabelle e viste. Puoi concedere ruoli IAM a utenti, gruppi e account di servizio. Questi ruoli definiscono cosa possono fare con le tue risorse.
- Controlli di accesso a livello di colonna e controlli di accesso a livello di riga. I controlli di accesso a livello di riga e colonna ti consentono di limitare l'accesso a determinate righe e colonne di una tabella in base agli attributi utente o ai valori dei dati. Questo controllo ti consente di implementare un accesso granulare per contribuire a proteggere i dati sensibili da accessi non autorizzati.
- Gestione del trasferimento dei dati. I Controlli di servizio VPC ti consentono di creare perimetri attorno alle risorse Google Cloud e di controllare l'accesso a queste risorse in base ai criteri della tua organizzazione.
- Log di controllo. Gli audit log forniscono un record dettagliato delle attività utente e degli eventi di sistema nella tua organizzazione. Questi log ti aiutano a applicare i criteri di governance dei dati e a identificare potenziali rischi per la sicurezza.
Passaggi successivi per controllo dell'accesso'accesso
La seguente tabella illustra i passaggi successivi che puoi svolgere per saperne di più sulle funzionalità di controllo dell'accesso'accesso:
Livello di esperienza | Percorso di apprendimento |
---|---|
Nuovi utenti cloud |
|
Utenti esperti del cloud |
|
Gestione e controllo dei dati
La gestione dei dati contribuisce a proteggere i dati sensibili categorizzandoli, mascherandoli, oscurandoli o criptandoli in modo appropriato durante le query, il transito o l'archiviazione. Questo approccio migliora l'organizzazione e la protezione dei dati. BigQuery fornisce le seguenti funzionalità per aiutarti con la gestione dei dati:
- Masking dei dati. Il mascheramento dei dati consente di oscurare i dati sensibili in una tabella, continuando però a consentire agli utenti autorizzati di accedere ai dati circostanti. Può anche nascondere i dati che corrispondono a pattern di dati sensibili, proteggendoli dalla divulgazione accidentale.
- Crittografia. BigQuery cripta automaticamente tutti i dati inattivi e in transito, consentendoti al contempo di personalizzare le impostazioni di crittografia in base alle tue esigenze e ai tuoi requisiti specifici.
- Gestione dei metadati. La gestione dei metadati ti consente di taggare le risorse, il che ti aiuta a eseguire ricerche, organizzare e classificare i dati.
Passaggi successivi per la gestione dei dati
La seguente tabella illustra i passaggi successivi che puoi svolgere per saperne di più sulle funzionalità di gestione dei dati:
Livello di esperienza | Percorso di apprendimento |
---|---|
Nuovi utenti cloud |
|
Utenti esperti del cloud |
|
Qualità dei dati
La gestione della qualità dei dati è il processo di tracciamento della derivazione dei dati e di verifica dell'adeguatezza dei dati ai tuoi standard di accuratezza, completezza e coerenza. BigQuery fornisce le seguenti funzionalità per aiutarti con la qualità dei dati:
- Rispetta la struttura dei dati. La derivazione dei dati consente di monitorare il flusso dei dati nel tempo, fornendo informazioni sull'origine dei dati, sulle relative variazioni nel tempo e sulla destinazione finale all'interno del sistema.
- Scansioni dei profili di dati. Le analisi del profilo dei dati ti consentono di analizzare le caratteristiche statistiche dei tuoi dati, ad esempio valori medi e univoci.
- Scansioni della qualità dei dati. Le analisi della qualità dei dati ti consentono di eseguire controlli dei dati, convalidare i dati in base a regole definite e risolvere i problemi relativi alla qualità dei dati.
Passaggi successivi per la qualità dei dati
La tabella seguente illustra i passaggi successivi che puoi svolgere per scoprire di più sulle funzionalità di accesso alla qualità dei dati:
Livello di esperienza | Percorso di apprendimento |
---|---|
Nuovi utenti cloud |
|
Utenti esperti del cloud |
|
Passaggi successivi
- Scopri di più sull'autenticazione su Google.
- Scopri di più sull'eliminazione dei dati su Google Cloud.
- Scopri di più sulle best practice per l'IAM.
- Scopri la gerarchia delle risorse su Google Cloud.
- Scopri di più su IAM su Google Cloud.