Einführung in Data Governance in BigQuery

Dieses Dokument bietet eine Einführung in die BigQuery-Data Governance und erläutert, wie Sie BigQuery-Features verwenden können, um BigQuery-Data-Governance-Richtlinien zu implementieren und durchzusetzen. Eine umfassendere Übersicht über Data Governance in Google Cloud finden Sie unter Was ist Data Governance?.

Data Governance ist die Verwaltung der Sicherheit und Qualität von Daten über ihren gesamten Lebenszyklus hinweg, um sicherzustellen, dass der Zugriff und die Genauigkeit den Organisationsrichtlinien und -bestimmungen entsprechen. Diese Data Governance-Prioritäten können in drei Kategorien unterteilt werden:

Zugriffskontrolle
Datenadministration
Datenqualität

In den folgenden Abschnitten werden diese Data Governance-Kategorien definiert und es wird erläutert, wie sie von BigQuery-Features unterstützt werden. Außerdem erhalten Sie Empfehlungen für die nächsten Schritte.

Zugriffssteuerung

Die Zugriffsverwaltung ist der Prozess des Definierens, Durchsetzens und Überwachens der Regeln und Richtlinien, die den Zugriff auf Daten steuern. Durch die Zugriffsverwaltung wird sichergestellt, dass Daten nur für jene Nutzer zugänglich sind, die zum Zugriff berechtigt sind. BigQuery bietet die folgenden Features, die Ihnen beim Datenzugriff helfen:

Identity and Access Management (IAM) Mit IAM können Sie steuern, wer Zugriff auf Ihre BigQuery-Ressourcen hat, z. B. Projekte, Datasets, Tabellen und Ansichten. Sie können Nutzern, Gruppen und Dienstkonten IAM-Rollen zuweisen. Diese Rollen definieren, was sie mit Ihren Ressourcen tun können.
Zugriffssteuerungen auf Spaltenebene und Zugriffssteuerungen auf Zeilenebene. Mit den Zugriffssteuerungen auf Spalten- und Zeilenebene können Sie den Zugriff auf bestimmte Spalten und Zeilen in einer Tabelle anhand von Nutzerattributen oder Datenwerten beschränken. Mit dieser Steuerung können Sie detaillierten Zugriff implementieren und so sensible Daten vor unbefugtem Zugriff schützen.
Datenübertragungsverwaltung: Mit VPC Service Controls können Sie Perimeter um Google Cloud-Ressourcen erstellen und den Zugriff auf diese Ressourcen basierend auf den Richtlinien Ihrer Organisation steuern.
Audit-Logs. Audit-Logs bieten Ihnen eine detaillierte Aufzeichnung der Nutzeraktivitäten und Systemereignisse in Ihrer Organisation. Mit diesen Logs können Sie Data Governance-Richtlinien erzwingen und potenzielle Sicherheitsrisiken identifizieren.

Nächste Schritte für die Zugriffssteuerung

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Funktionen der Zugriffssteuerung erfahren können:

Erfahrungsstufe	Lernpfad
Neue Cloud-Nutzer	Sehen Sie sich die vordefinierten Rollen in BigQuery an und überlegen Sie, wie sie nach dem Prinzip der geringsten Berechtigung zugewiesen werden können.
Erfahrene Cloud-Nutzer	Für mehr Flexibilität und Granularität bei der Verwaltung Ihrer Berechtigungen sollten Sie benutzerdefinierte Rollen erstellen, die Ihren Anforderungen entsprechen. Fügen Sie Zeilen- und Spaltenkontrollen hinzu, um den Zugriff auf bestimmte Zeilen und Spalten in Ihren Tabellen zu steuern. Richten Sie einen Perimeter für Ihre Google Cloud-Ressourcen ein, indem Sie VPC Service Controls einrichten.

Erfahrungsstufe

Lernpfad

Neue Cloud-Nutzer

Sehen Sie sich die vordefinierten Rollen in BigQuery an und überlegen Sie, wie sie nach dem Prinzip der geringsten Berechtigung zugewiesen werden können.

Erfahrene Cloud-Nutzer

Für mehr Flexibilität und Granularität bei der Verwaltung Ihrer Berechtigungen sollten Sie benutzerdefinierte Rollen erstellen, die Ihren Anforderungen entsprechen.
Fügen Sie Zeilen- und Spaltenkontrollen hinzu, um den Zugriff auf bestimmte Zeilen und Spalten in Ihren Tabellen zu steuern.
Richten Sie einen Perimeter für Ihre Google Cloud-Ressourcen ein, indem Sie VPC Service Controls einrichten.

Datenadministration

Die Datensicherung trägt zum Schutz sensibler Daten bei. Dazu werden sie während der Abfrage, der Übertragung oder des Speichers entsprechend kategorisiert, maskiert, entfernt oder verschlüsselt. Dieser Ansatz verbessert den Datenschutz und die Organisation. BigQuery bietet die folgenden Funktionen, die Sie beim Data Stewardship unterstützen:

Datenmaskierung. Mit der Datenmaskierung können Sie sensible Daten in einer Tabelle verbergen und gleichzeitig autorisierten Nutzern den Zugriff auf die umgebenden Daten erlauben. Außerdem können damit Daten maskiert werden, die mit sensiblen Datenmustern übereinstimmen, um eine versehentliche Offenlegung von Daten zu verhindern.
Verschlüsselung. BigQuery verschlüsselt automatisch alle inaktiven Daten und alle Daten, die übertragen werden. Dabei können Sie die Verschlüsselungseinstellungen an Ihre speziellen Anforderungen anpassen.
Metadatenverwaltung. Die Metadatenverwaltung ermöglicht Ihnen die Kennzeichnung von Ressourcen, was Ihnen bei der Datensuche, Organisation und Kategorisierung hilft.

Nächste Schritte für Data Stewardship

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Data Stewardship-Funktionen erfahren können:

Erfahrungsstufe	Lernpfad
Neue Cloud-Nutzer	Erfahren Sie, wie Google Ihre Daten standardmäßig bei Inaktivität und bei der Übertragung verschlüsselt.
Erfahrene Cloud-Nutzer	Fügen Sie die Datenmaskierung auf Spaltenebene in die Tabelle ein, um die Freigabe von Informationen über Ihre Organisation zu vereinfachen, ohne sensible Daten preiszugeben. Mit Sensitive Data Protection können Sie Ihre Daten auf vertrauliche und riskante Informationen wie personenidentifizierbare Informationen, Finanzdaten und Gesundheitsdaten scannen.

Datenqualität

Das Datenqualitätsmanagement ist der Prozess des Tracings der Herkunft von Daten und sorgt dafür, dass Daten Ihren Standards für Genauigkeit, Vollständigkeit und Konsistenz entsprechen. BigQuery bietet die folgenden Features, die Ihnen bei der Datenqualität helfen:

Data Lineage. Mit Data Lineage können Sie den Ablauf Ihrer Daten im Zeitverlauf beobachten. Dabei erhalten Sie Einblicke in den Ursprung der Daten, wie sich diese im Laufe der Zeit ändern und welches endgültige Ziel sie in Ihrem System haben.
Datenprofilscans: Mit Datenprofilscans können Sie die statistischen Merkmale Ihrer Daten analysieren, z. B. den Durchschnittswert und die eindeutigen Werte.
Datenqualitätsscans. Mit Datenqualitätsscans können Sie Datenprüfungen durchführen, Ihre Daten anhand definierter Regeln validieren und Probleme mit der Datenqualität beheben.

Nächste Schritte für Datenqualität

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Qualität der Zugriffsdaten erfahren können:

Erfahrungsstufe	Lernpfad
Neue Cloud-Nutzer	Führen Sie einen Datenprofilscan durch, um Informationen zu Ihren Daten zu erhalten, einschließlich der Limits oder Durchschnittswerte Ihrer Daten.
Erfahrene Cloud-Nutzer	Aktivieren Sie Data Lineage in Ihrem BigQuery-Projekt, um Herkunftsinformationen für BigQuery-Vorgänge wie Laden, Kopieren und Datenänderungen automatisch aufzuzeichnen. Richten Sie einen wiederkehrenden Datenqualitätsscan ein, um über mögliche Probleme mit vordefinierten Scanregeln informiert zu werden. Richten Sie benutzerdefinierte Datenregeln für Ihre Datenqualitätsscans ein, damit Ihre Scans auf Ihre spezifischen Anforderungen zugeschnitten sind.

Erfahrungsstufe

Lernpfad

Neue Cloud-Nutzer

Führen Sie einen Datenprofilscan durch, um Informationen zu Ihren Daten zu erhalten, einschließlich der Limits oder Durchschnittswerte Ihrer Daten.

Erfahrene Cloud-Nutzer

Aktivieren Sie Data Lineage in Ihrem BigQuery-Projekt, um Herkunftsinformationen für BigQuery-Vorgänge wie Laden, Kopieren und Datenänderungen automatisch aufzuzeichnen.
Richten Sie einen wiederkehrenden Datenqualitätsscan ein, um über mögliche Probleme mit vordefinierten Scanregeln informiert zu werden.
Richten Sie benutzerdefinierte Datenregeln für Ihre Datenqualitätsscans ein, damit Ihre Scans auf Ihre spezifischen Anforderungen zugeschnitten sind.

Nächste Schritte

Weitere Informationen zur Authentifizierung bei Google
Informationen zur Datenlöschung in Google Cloud.
Informationen zu Best Practices für IAM
Ressourcenhierarchie in Google Cloud
Mehr über IAM in Google Cloud erfahren