Einführung in Data Governance in BigQuery

Dieses Dokument bietet eine Einführung in die BigQuery-Data Governance und erläutert, wie Sie BigQuery-Features verwenden können, um BigQuery-Data-Governance-Richtlinien zu implementieren und durchzusetzen. Eine umfassendere Übersicht über Data Governance in Google Cloud finden Sie unter Was ist Data Governance?.

Data Governance ist die Verwaltung der Sicherheit und Qualität von Daten über ihren gesamten Lebenszyklus hinweg, um sicherzustellen, dass der Zugriff und die Genauigkeit den Organisationsrichtlinien und -bestimmungen entsprechen. Diese Data Governance-Prioritäten können in drei Kategorien unterteilt werden:

In den folgenden Abschnitten werden diese Data Governance-Kategorien definiert und es wird erläutert, wie sie von BigQuery-Features unterstützt werden. Außerdem erhalten Sie Empfehlungen für die nächsten Schritte.

Zugriffssteuerung

Die Zugriffsverwaltung ist der Prozess des Definierens, Durchsetzens und Überwachens der Regeln und Richtlinien, die den Zugriff auf Daten steuern. Durch die Zugriffsverwaltung wird sichergestellt, dass Daten nur für jene Nutzer zugänglich sind, die zum Zugriff berechtigt sind. BigQuery bietet die folgenden Features, die Ihnen beim Datenzugriff helfen:

  • Identity and Access Management (IAM) Mit IAM können Sie steuern, wer Zugriff auf Ihre BigQuery-Ressourcen hat, z. B. Projekte, Datasets, Tabellen und Ansichten. Sie können Nutzern, Gruppen und Dienstkonten IAM-Rollen zuweisen. Diese Rollen definieren, was sie mit Ihren Ressourcen tun können.
  • Zugriffssteuerungen auf Spaltenebene und Zugriffssteuerungen auf Zeilenebene. Mit den Zugriffssteuerungen auf Spalten- und Zeilenebene können Sie den Zugriff auf bestimmte Spalten und Zeilen in einer Tabelle anhand von Nutzerattributen oder Datenwerten beschränken. Mit dieser Steuerung können Sie detaillierten Zugriff implementieren und so sensible Daten vor unbefugtem Zugriff schützen.
  • Datenübertragungsverwaltung: Mit VPC Service Controls können Sie Perimeter um Google Cloud-Ressourcen erstellen und den Zugriff auf diese Ressourcen basierend auf den Richtlinien Ihrer Organisation steuern.
  • Audit-Logs. Audit-Logs bieten Ihnen eine detaillierte Aufzeichnung der Nutzeraktivitäten und Systemereignisse in Ihrer Organisation. Mit diesen Logs können Sie Data Governance-Richtlinien erzwingen und potenzielle Sicherheitsrisiken identifizieren.

Nächste Schritte für die Zugriffssteuerung

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Funktionen der Zugriffssteuerung erfahren können:

Erfahrungsstufe Lernpfad
Neue Cloud-Nutzer
Erfahrene Cloud-Nutzer

Datenadministration

Die Datensicherung trägt zum Schutz sensibler Daten bei. Dazu werden sie während der Abfrage, der Übertragung oder des Speichers entsprechend kategorisiert, maskiert, entfernt oder verschlüsselt. Dieser Ansatz verbessert den Datenschutz und die Organisation. BigQuery bietet die folgenden Funktionen, die Sie beim Data Stewardship unterstützen:

  • Datenmaskierung. Mit der Datenmaskierung können Sie sensible Daten in einer Tabelle verbergen und gleichzeitig autorisierten Nutzern den Zugriff auf die umgebenden Daten erlauben. Außerdem können damit Daten maskiert werden, die mit sensiblen Datenmustern übereinstimmen, um eine versehentliche Offenlegung von Daten zu verhindern.
  • Verschlüsselung. BigQuery verschlüsselt automatisch alle inaktiven Daten und alle Daten, die übertragen werden. Dabei können Sie die Verschlüsselungseinstellungen an Ihre speziellen Anforderungen anpassen.
  • Metadatenverwaltung. Die Metadatenverwaltung ermöglicht Ihnen die Kennzeichnung von Ressourcen, was Ihnen bei der Datensuche, Organisation und Kategorisierung hilft.

Nächste Schritte für Data Stewardship

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Data Stewardship-Funktionen erfahren können:

Erfahrungsstufe Lernpfad
Neue Cloud-Nutzer
Erfahrene Cloud-Nutzer
  • Fügen Sie die Datenmaskierung auf Spaltenebene in die Tabelle ein, um die Freigabe von Informationen über Ihre Organisation zu vereinfachen, ohne sensible Daten preiszugeben.
  • Mit Sensitive Data Protection können Sie Ihre Daten auf vertrauliche und riskante Informationen wie personenidentifizierbare Informationen, Finanzdaten und Gesundheitsdaten scannen.

Datenqualität

Das Datenqualitätsmanagement ist der Prozess des Tracings der Herkunft von Daten und sorgt dafür, dass Daten Ihren Standards für Genauigkeit, Vollständigkeit und Konsistenz entsprechen. BigQuery bietet die folgenden Features, die Ihnen bei der Datenqualität helfen:

  • Data Lineage. Mit Data Lineage können Sie den Ablauf Ihrer Daten im Zeitverlauf beobachten. Dabei erhalten Sie Einblicke in den Ursprung der Daten, wie sich diese im Laufe der Zeit ändern und welches endgültige Ziel sie in Ihrem System haben.
  • Datenprofilscans: Mit Datenprofilscans können Sie die statistischen Merkmale Ihrer Daten analysieren, z. B. den Durchschnittswert und die eindeutigen Werte.
  • Datenqualitätsscans. Mit Datenqualitätsscans können Sie Datenprüfungen durchführen, Ihre Daten anhand definierter Regeln validieren und Probleme mit der Datenqualität beheben.

Nächste Schritte für Datenqualität

In der folgenden Tabelle werden die nächsten Schritte beschrieben, mit denen Sie mehr über die Qualität der Zugriffsdaten erfahren können:

Erfahrungsstufe Lernpfad
Neue Cloud-Nutzer
  • Führen Sie einen Datenprofilscan durch, um Informationen zu Ihren Daten zu erhalten, einschließlich der Limits oder Durchschnittswerte Ihrer Daten.
Erfahrene Cloud-Nutzer

Nächste Schritte