Introduzione alla governance dei dati in BigQuery

Questo documento fornisce un'introduzione alla governance dei dati di BigQuery e illustra come utilizzare le funzionalità di BigQuery per implementare e applicare i criteri di governance dei dati di BigQuery. Per una panoramica più completa della governance dei dati in Google Cloud, consulta Che cos'è la governance dei dati?

La governance dei dati è la gestione della sicurezza e della qualità dei dati durante il loro ciclo di vita per garantire che l'accesso e l'accuratezza siano conformi ai criteri e alle normative dell'organizzazione. Queste priorità di governance dei dati possono essere suddivise in tre categorie:

Le sezioni seguenti definiscono queste categorie di governance dei dati, descrivono in che modo le funzionalità di BigQuery le supportano e consigliano i passaggi successivi.

Controllo degli accessi

La gestione dell'accesso ai dati è il processo di definizione, applicazione e monitoraggio delle regole e delle norme che regolano chi ha accesso ai dati. La gestione dell'accesso garantisce che i dati siano accessibili solo a chi è autorizzato. BigQuery fornisce le seguenti funzionalità per aiutarti con l'accesso ai dati:

  • Identity and Access Management (IAM). IAM ti consente di controllare chi ha accesso alle tue risorse BigQuery, come progetti, set di dati, tabelle e viste. Puoi concedere ruoli IAM a utenti, gruppi e account di servizio. Questi ruoli definiscono cosa possono fare con le tue risorse.
  • Controlli di accesso a livello di colonna e controlli di accesso a livello di riga. I controlli di accesso a livello di riga e colonna ti consentono di limitare l'accesso a determinate righe e colonne di una tabella in base agli attributi utente o ai valori dei dati. Questo controllo ti consente di implementare un accesso granulare per contribuire a proteggere i dati sensibili da accessi non autorizzati.
  • Gestione del trasferimento dei dati. I Controlli di servizio VPC ti consentono di creare perimetri attorno alle risorse Google Cloud e di controllare l'accesso a queste risorse in base ai criteri della tua organizzazione.
  • Log di controllo. Gli audit log forniscono un record dettagliato delle attività utente e degli eventi di sistema nella tua organizzazione. Questi log ti aiutano a applicare i criteri di governance dei dati e a identificare potenziali rischi per la sicurezza.

Passaggi successivi per controllo dell'accesso'accesso

La seguente tabella illustra i passaggi successivi che puoi svolgere per saperne di più sulle funzionalità di controllo dell'accesso'accesso:

Livello di esperienza Percorso di apprendimento
Nuovi utenti cloud
Utenti esperti del cloud

Gestione e controllo dei dati

La gestione dei dati contribuisce a proteggere i dati sensibili categorizzandoli, mascherandoli, oscurandoli o criptandoli in modo appropriato durante le query, il transito o l'archiviazione. Questo approccio migliora l'organizzazione e la protezione dei dati. BigQuery fornisce le seguenti funzionalità per aiutarti con la gestione dei dati:

  • Masking dei dati. Il mascheramento dei dati consente di oscurare i dati sensibili in una tabella, continuando però a consentire agli utenti autorizzati di accedere ai dati circostanti. Può anche nascondere i dati che corrispondono a pattern di dati sensibili, proteggendoli dalla divulgazione accidentale.
  • Crittografia. BigQuery cripta automaticamente tutti i dati inattivi e in transito, consentendoti al contempo di personalizzare le impostazioni di crittografia in base alle tue esigenze e ai tuoi requisiti specifici.
  • Gestione dei metadati. La gestione dei metadati ti consente di taggare le risorse, il che ti aiuta a eseguire ricerche, organizzare e classificare i dati.

Passaggi successivi per la gestione dei dati

La seguente tabella illustra i passaggi successivi che puoi svolgere per saperne di più sulle funzionalità di gestione dei dati:

Livello di esperienza Percorso di apprendimento
Nuovi utenti cloud
  • Scopri in che modo Google cripta i tuoi dati at-rest e in transito per impostazione predefinita.
Utenti esperti del cloud

Qualità dei dati

La gestione della qualità dei dati è il processo di tracciamento della derivazione dei dati e di verifica dell'adeguatezza dei dati ai tuoi standard di accuratezza, completezza e coerenza. BigQuery fornisce le seguenti funzionalità per aiutarti con la qualità dei dati:

  • Rispetta la struttura dei dati. La derivazione dei dati consente di monitorare il flusso dei dati nel tempo, fornendo informazioni sull'origine dei dati, sulle relative variazioni nel tempo e sulla destinazione finale all'interno del sistema.
  • Scansioni dei profili di dati. Le analisi del profilo dei dati ti consentono di analizzare le caratteristiche statistiche dei tuoi dati, ad esempio valori medi e univoci.
  • Scansioni della qualità dei dati. Le analisi della qualità dei dati ti consentono di eseguire controlli dei dati, convalidare i dati in base a regole definite e risolvere i problemi relativi alla qualità dei dati.

Passaggi successivi per la qualità dei dati

La tabella seguente illustra i passaggi successivi che puoi svolgere per scoprire di più sulle funzionalità di accesso alla qualità dei dati:

Livello di esperienza Percorso di apprendimento
Nuovi utenti cloud
Utenti esperti del cloud

Passaggi successivi