Einführung in Data Governance in BigQuery

In diesem Dokument erhalten Sie eine Einführung in die BigQuery-Datenverwaltung und erfahren, wie Sie BigQuery-Funktionen verwenden können, um BigQuery-Richtlinien zur Datenverwaltung zu implementieren und durchzusetzen. Einen umfassenderen Überblick über die Datenverwaltung in Google Cloud finden Sie unter Was ist Data Governance?

Data Governance ist die Verwaltung der Sicherheit und Qualität von Daten während ihres gesamten Lebenszyklus, um sicherzustellen, dass der Zugriff und die Richtigkeit den organisatorischen Richtlinien und Bestimmungen entsprechen. Diese Prioritäten der Datenverwaltung lassen sich in drei Kategorien unterteilen:

In den folgenden Abschnitten werden diese Datengovernance-Kategorien definiert, die BigQuery-Funktionen beschrieben, die sie unterstützen, und die nächsten Schritte empfohlen.

Zugriffssteuerung

Die Zugriffsverwaltung ist der Prozess des Definierens, Durchsetzens und Überwachens der Regeln und Richtlinien, die den Zugriff auf Daten steuern. Die Zugriffsverwaltung sorgt dafür, dass nur Personen auf Daten zugreifen können, die dazu berechtigt sind. BigQuery bietet die folgenden Funktionen, die Sie beim Datenzugriff unterstützen:

  • Identity and Access Management (IAM) Mit IAM können Sie steuern, wer Zugriff auf Ihre BigQuery-Ressourcen wie Projekte, Datasets, Tabellen und Ansichten hat. Sie können Nutzern, Gruppen und Dienstkonten IAM-Rollen zuweisen. Diese Rollen definieren, was sie mit Ihren Ressourcen tun können.
  • Zugriffssteuerungen auf Spaltenebene und Zugriffssteuerungen auf Zeilenebene Mit Zugriffssteuerungen auf Spalten- und Zeilenebene können Sie den Zugriff auf bestimmte Spalten und Zeilen in einer Tabelle basierend auf Nutzerattributen oder Datenwerten einschränken. Mit dieser Steuerung können Sie detaillierten Zugriff implementieren und so sensible Daten vor unbefugtem Zugriff schützen.
  • Datenübertragungsverwaltung Mit VPC Service Controls können Sie Perimeter um Google Cloud-Ressourcen erstellen und den Zugriff auf diese Ressourcen gemäß den Richtlinien Ihrer Organisation steuern.
  • Audit-Logs. Audit-Logs enthalten detaillierte Informationen zu Nutzeraktivitäten und Systemereignissen in Ihrer Organisation. Anhand dieser Protokolle können Sie Richtlinien zur Datenverwaltung durchsetzen und potenzielle Sicherheitsrisiken erkennen.

Nächste Schritte für die Zugriffssteuerung

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Funktionen zur Zugriffssteuerung erfahren können:

Erfahrungsstufe Lernpfad
Neue Cloud-Nutzer
Erfahrene Cloud-Nutzer

Datenadministration

Mit der Datenverwaltung werden sensible Daten geschützt, indem sie bei der Abfrage, Übertragung oder Speicherung richtig kategorisiert, maskiert, entfernt oder verschlüsselt werden. Dieser Ansatz verbessert den Datenschutz und die Organisation. BigQuery bietet die folgenden Funktionen, die Sie beim Data Stewardship unterstützen:

  • Datenmaskierung. Mit der Datenmaskierung können Sie sensible Daten in einer Tabelle verbergen und gleichzeitig autorisierten Nutzern den Zugriff auf die umgebenden Daten erlauben. Außerdem können Daten, die sensiblen Datenmustern entsprechen, maskiert werden, um eine versehentliche Datenweitergabe zu verhindern.
  • Verschlüsselung. BigQuery verschlüsselt automatisch alle inaktiven Daten und alle Daten, die übertragen werden. Dabei können Sie die Verschlüsselungseinstellungen an Ihre speziellen Anforderungen anpassen.
  • Metadatenverwaltung. Mit der Metadatenverwaltung können Sie Ressourcen taggen, was Ihnen wiederum bei der Datensuche, -organisation und -kategorisierung hilft.

Nächste Schritte für Data Stewardship

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Data Stewardship-Funktionen erfahren können:

Erfahrungsstufe Lernpfad
Neue Cloud-Nutzer
Erfahrene Cloud-Nutzer
  • Fügen Sie Ihrer Tabelle Datenmaskierung auf Spaltenebene hinzu, um die Weitergabe von Informationen innerhalb Ihrer Organisation zu erleichtern, ohne sensible Daten preiszugeben.
  • Mit Sensitive Data Protection können Sie Ihre Daten auf vertrauliche und riskante Informationen wie personenidentifizierbare Informationen, Finanzdaten und Gesundheitsdaten scannen.

Datenqualität

Beim Datenqualitätsmanagement wird die Datenherkunft nachverfolgt und dafür gesorgt, dass die Daten Ihre Standards für Genauigkeit, Vollständigkeit und Konsistenz erfüllen. BigQuery bietet die folgenden Funktionen, die Sie bei der Datenqualität unterstützen:

  • Data Lineage. Mit Data Lineage können Sie den Ablauf Ihrer Daten im Zeitverlauf beobachten. Dabei erhalten Sie Einblicke in den Ursprung der Daten, wie sich diese im Laufe der Zeit ändern und welches endgültige Ziel sie in Ihrem System haben.
  • Datenprofilscans Mit Datenprofilscans können Sie die statistischen Merkmale Ihrer Daten analysieren, z. B. Durchschnitts- und eindeutige Werte.
  • Datenqualitätsscans. Mit Datenqualitätsscans können Sie Datenprüfungen durchführen, Ihre Daten anhand definierter Regeln validieren und Probleme mit der Datenqualität beheben.

Nächste Schritte für die Datenqualität

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Funktionen zur Datenqualität erfahren können:

Erfahrungsstufe Lernpfad
Neue Cloud-Nutzer
  • Führen Sie einen Datenprofil-Scan durch, um Statistiken zu Ihren Daten zu erhalten, einschließlich der Limits oder Durchschnittswerte.
Erfahrene Cloud-Nutzer

Nächste Schritte