In diesem Dokument wird die Verwendung des Dataplex-Attributspeichers erläutert.
Der Dataplex-Attributspeicher ist eine erweiterbare Infrastruktur, mit der Sie richtlinienbezogenes Verhalten für die zugehörigen Ressourcen angeben können. Dataplex-Administratoren können mit dem Attributspeicher festlegen, wie bestimmte Daten verarbeitet werden sollen. Dazu verknüpfen sie Daten mit Attributen.
Der Hauptvorteil des Attributspeichers besteht darin, dass Sie einem Objekt, z. B. einer Spalte, mehrere Attribute hinzufügen können. Der Attributspeicher führt das Verhalten aller Attribute zusammen, die mit einem Objekt verknüpft sind, und stellt es als einzelne Richtlinie für die zugrunde liegende Ressource dar.
Sie können Attribute für veröffentlichte Datasets festlegen. Veröffentlichte Datasets beziehen sich auf die Datasets, die von Dataplex aus den erkannten Tabellen in einem Bucket-Asset erstellt wurden.
Die folgenden Richtlinienverhalten werden unterstützt:
- Ressourcenspezifikationen: Gibt den Zugriff auf eine Ressource an, z. B. eine Tabelle.
- Spaltenspezifikationen: Gibt den Zugriff auf eine Spalte in einer BigQuery-Tabelle an.
Im Attributspeicher können Sie eine Attributhierarchie definieren, die als Taxonomie bezeichnet wird. In einer Taxonomie übernimmt ein untergeordnetes Attribut Spezifikationen von der übergeordneten Attributhierarchie. Die Spezifikationen des übergeordneten Elements des untergeordneten Elements werden zu einer einheitlichen Liste zusammengeführt, die an die Ressource weitergegeben wird.
Mit dem Dataplex-Attributspeicher können Sie Folgendes ausführen:
- Taxonomien erstellen
- Attribute erstellen und in einer Hierarchie organisieren.
- Verknüpfen Sie ein oder mehrere Attribute mit Tabellen.
- Verknüpfen Sie ein oder mehrere Attribute mit Spalten.
Terminologie
Die folgende Terminologie wird in diesem Dokument verwendet:
Attributtaxonomie
Eine Datentaxonomie ist eine Hierarchie von Attributen. In einer Taxonomie ermöglichen die Attribute in übergeordneten Knoten, dass Attribute unter ihnen (untergeordnete Attribute) die Verhaltensspezifikationen übergeordneter Attribute übernehmen und zu ihren eigenen hinzufügen.
Beispiel: Wenn ein Attribut namens PII
eine Ressourcenspezifikation group-a@company.com
und ein untergeordnetes Attribut von PII
mit dem Namen Social Security numbers
die Ressourcenspezifikation group-b@company.com
hat, gelten die Ressourcenspezifikationen für die Richtlinien, mit denen das Attribut Social Security numbers
verknüpft ist, als group-a@company.com
und group-b@company.com
.
Wenn Sie ein Attribut definieren, können Sie auswählen, ob es sich um ein übergeordnetes oder ein untergeordnetes Attribut handelt. Wenn Sie ein untergeordnetes Attribut definieren, müssen Sie das zugehörige übergeordnete Attribut angeben.
Spaltenspezifikationen
Die Verhaltensspezifikationen für Spalten. Damit werden Personen oder Gruppen angegeben, die Leserzugriff auf Spalten haben. Wenn Sie ein Attribut mit einer Spaltenspezifikation mit der Spalte einer Tabelle verknüpfen, wird dieser Spalte ein BigQuery-Spaltenrichtlinien-Tag hinzugefügt.
Ressourcenspezifikationen
Die Berechtigungen für Personen oder Gruppen, um auf Ressourcen (Tabellen) zuzugreifen. Wenn Sie ein Attribut mit einer Ressourcenspezifikation verknüpfen, leitet Dataplex den angegebenen Nutzern IAM-Rollen weiter, damit diese auf die mit dem Attribut verknüpften Tabellen zugreifen können.
Hinweise
Beschränkungen
Dataplex leitet die Richtlinien für die Spaltenspezifikation als BigQuery-Richtlinien-Tags weiter. In BigQuery ist nur ein Richtlinien-Tag pro Spalte zulässig. Wenn in einer Spalte bereits ein Richtlinien-Tag vorhanden ist, gibt Dataplex einen Fehler im Governance-Log auf dem Tab Manage (Verwalten) aus.
Kontingente
Im Folgenden sind die Kontingente und Limits für den Dataplex-Attributspeicher aufgeführt:
Limit | Standard |
---|---|
Maximale Anzahl von Taxonomien in einer Region | 100 |
Maximale Anzahl von Attributen in allen Taxonomien in einer Region | 10.000 |
Maximale Anzahl von Attributen, die einer Ressource (Tabelle) zugeordnet werden können | 50 |
Maximale Anzahl von Attributen, die mit einer Spalte verknüpft werden können | 100 |
Maximale Tiefe pro Datenattributbaum in einer Attributtaxonomie | 4 |
Erforderliche Rollen und Berechtigungen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zu gewähren, um die Berechtigungen zu erhalten, die Sie für die Verwendung des Dataplex-Attributspeichers benötigen:
-
Taxonomien und Attribute verwalten:
Dataplex-Taxonomie-Administrator (
roles/dataplex.taxonomyAdmin
) -
Bindungen aufrufen, die mit Ressourcen und Attributen verknüpft sind:
Dataplex-Taxonomiebetrachter (
roles/dataplex.taxonomyViewer
) -
Erstellen und verwalten Sie Bindungsressourcen in einem Projekt:
-
Administrator von Dataplex-Bindungen (
roles/dataplex.bindingAdmin
) -
Dataplex-Administrator (
roles/dataplex.admin
für Zonenressource)
-
Administrator von Dataplex-Bindungen (
-
Verwalten Sie Ressourcen- und Datenzugriffsspezifikationen:
Dataplex-Sicherheitsadministrator (
roles/dataplex.securityAdmin
)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zur Verwendung des Dataplex-Attributspeichers erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um den Dataplex-Attributspeicher zu verwenden:
-
Taxonomien und Attribute verwalten:
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Rufen Sie die mit Ressourcen und Attributen verknüpften Bindungen auf:
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Erstellen und verwalten Sie Bindungsressourcen in einem Projekt:
dataplex.dataattributebindings.*
-
Verwalten Sie die Spezifikationen für den Ressourcen- und Datenzugriff:
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
Möglicherweise können Sie diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Beispielanwendungsfälle
Nehmen wir als Beispiel ein Unternehmen namens ACME, das drei Arten von Daten hat:
Red
-Daten, die vertraulich sind.Green
-Daten, die eingeschränkt, aber weniger vertraulich sind.- Nicht kategorisierte Daten.
Der Dataplex-Administrator von ACME erstellt die folgenden Attribute:
Attribut:
Red
- Spaltenspezifikationen:
secrets_team@acme
mit Leseberechtigung - Ressourcenspezifikationen:
secrets_team@acme
undtenured_employees@acme
mit Leseberechtigung
- Spaltenspezifikationen:
Attribut:
Green
- Spaltenspezifikationen:
full_time_employees@acme
mit Leseberechtigung - Ressourcenspezifikationen:
full_time_employees@acme
mit Bearbeitungsberechtigung
- Spaltenspezifikationen:
Die Attribute Red
und Green
steuern das Zugriffsverhalten auf die Ressourcen (Tabellen) in Abhängigkeit von den Attributen, die den Tabellen und ihren Spalten zugeordnet sind.
Betrachten Sie eine Tabelle mit den folgenden Spalten:
- ID
- Postleitzahl
- Name
- Adresse
- $Value
Anwendungsfall 1: Verknüpfen Sie dasselbe Attribut mit der Tabelle und einer Spalte
Wenn Sie das Attribut Red
mit der Tabelle und ihrer Spalte Name verknüpfen, werden von Dataplex die folgenden Richtlinien weitergegeben:
- Mitarbeiter in
secrets_team@acme
undtenured_employees@acme
können die Tabelle lesen, ihre Metadaten ansehen und sie abfragen. - Nur Mitarbeiter in
secrets_team@acme
können die Spalte Name abfragen, da sie durch Spaltenspezifikationen zusätzlich geschützt ist.
Anwendungsfall 2: Attribute kombinieren
Betrachten Sie die folgenden Verknüpfungen:
- Verknüpfen Sie die Attribute
Red
undGreen
mit der Tabelle. - Verknüpfen Sie die Attribute
Red
undGreen
mit der Spalte Name. - Verknüpfen Sie das Attribut
Red
mit der Spalte $Value.
In diesem Fall propagiert Dataplex die folgenden Richtlinien:
- Mitarbeiter in
secrets_team@acme
,tenured_employees@acme
undfull_time_employees@acme
können auf die Tabelle zugreifen. Das liegt daran, dass Dataplex die Ressourcenspezifikationen der AttributeRed
undGreen
zusammenführt. - Mitarbeiter in
secrets_team@acme
undfull_time_employees@acme
können auf die Spalte Name zugreifen. Dies liegt daran, dass Dataplex die Spaltenspezifikationen der AttributeRed
undGreen
zusammenführt. - Nur Mitarbeiter in
secrets_team@acme
können die Spalte $Value abfragen.
Anwendungsfall 3: Attribute in einer Hierarchie organisieren
Sie können Attribute in einer Hierarchie organisieren, indem Sie die Untertypen der Attribute angeben. Betrachten Sie die folgenden Attribute:
Übergeordnetes Attribut 1:
Attribut: PII
- Spaltenspezifikationen:
secrets_team@acme
- Ressourcenspezifikationen:
secrets_team@acme
undtenured_employees@acme
Untergeordnetes Attribut von PII
:
Attribut: Email
- Spaltenspezifikationen:
email_comm@acme
- Ressourcenspezifikationen:
email_comm@acme
Übergeordnetes Attribut 2:
Attribut: Financial
- Spaltenspezifikationen:
full_time_employees@acme
- Ressourcenspezifikationen:
full_time_employees@acme
Betrachten Sie die folgenden Verknüpfungen:
- Verknüpfen Sie die Attribute
Email
undFinancial
mit der Tabelle. - Verknüpfen Sie die Attribute
Email
undFinancial
mit der Spalte Name. - Verknüpfen Sie das Attribut
PII
mit der Spalte $Value.
In diesem Fall propagiert Dataplex die folgenden Richtlinien:
- Mitarbeiter in
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
undemail_comm@acme
können auf die Tabelle zugreifen. Dies liegt daran, dass Dataplex die Ressourcenspezifikationen der AttributeFinancial
undEmail
zusammenführt und das AttributEmail
die Spezifikationen vom AttributPII
übernimmt. - Mitarbeiter in
secrets_team@acme
,email_comm@acme
undfull_time_employees@acme
können auf die Spalte Name zugreifen. Dies liegt daran, dass Dataplex die Spaltenspezifikationen der AttributeFinancial
undEmail
zusammenführt. - Nur Mitarbeiter in
secrets_team@acme
können die Spalte $Value abfragen.
Attribute einrichten
Um ein Attribut zu erstellen, müssen Sie zuerst eine Taxonomie und dann die übergeordneten und untergeordneten Datenattribute erstellen.
Datenattribut-Taxonomie erstellen
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Klicken Sie auf Taxonomie erstellen.
Geben Sie den Taxonomienamen, die ID und die Beschreibung ein.
Wählen Sie eine Region aus.
Klicken Sie auf Senden.
Die neue Taxonomie wird auf der Seite Datentaxonomien angezeigt.
Übergeordnetes Attribut erstellen
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Klicken Sie auf der Seite Datentaxonomien auf die Taxonomie, in der Sie das übergeordnete Attribut erstellen möchten.
Klicken Sie auf der Seite Taxonomiedetails auf Datenattribut hinzufügen.
Wählen Sie Übergeordnetes Datenattribut erstellen aus.
Geben Sie einen Namen, eine ID und eine Beschreibung für das übergeordnete Attribut ein.
Optional: Richten Sie Attributspezifikationen ein.
Richten Sie Ressourcenspezifikationen ein:
- Klicken Sie für die Ressource auf Berechtigungen verwalten.
- Klicken Sie auf Hinzufügen.
- Geben Sie im Feld Neue Hauptkonten die E-Mail-Adresse einer Person oder Gruppe ein, die Zugriff auf die Ressource benötigt.
- Wählen Sie die erforderlichen Rollen aus und klicken Sie auf Speichern.
- Klicken Sie auf Speichern.
So richten Sie Spaltenspezifikationen ein:
- Klicken Sie bei Spalte auf Berechtigungen verwalten.
- Klicken Sie auf Hinzufügen.
- Geben Sie im Feld Neue Hauptkonten die E-Mail-Adresse einer Person oder Gruppe ein, die Zugriff auf die Spalte benötigt.
- Wählen Sie die erforderlichen Rollen aus und klicken Sie auf Speichern.
- Klicken Sie auf Speichern.
Klicken Sie auf Erstellen.
Untergeordnetes Attribut erstellen
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Klicken Sie auf der Seite Datentaxonomien auf die Taxonomie, in der Sie das untergeordnete Attribut erstellen möchten.
Klicken Sie auf der Seite Taxonomiedetails auf Datenattribut hinzufügen.
Wählen Sie Untergeordnetes Datenattribut erstellen aus.
Wählen Sie für das untergeordnete Attribut, das Sie erstellen, ein übergeordnetes Datenattribut aus.
Geben Sie einen Namen, eine ID und eine Beschreibung für das untergeordnete Attribut ein.
Optional: Richten Sie Attributspezifikationen ein.
Richten Sie Ressourcenspezifikationen ein:
- Klicken Sie für die Ressource auf Berechtigungen verwalten.
- Klicken Sie auf Hinzufügen.
- Geben Sie im Feld Neue Hauptkonten die E-Mail-Adresse einer Person oder Gruppe ein, die Zugriff auf die Ressource benötigt.
- Wählen Sie die erforderlichen Rollen aus und klicken Sie auf Speichern.
- Klicken Sie auf Speichern.
So richten Sie Spaltenspezifikationen ein:
- Klicken Sie bei Spalte auf Berechtigungen verwalten.
- Klicken Sie auf Hinzufügen.
- Geben Sie im Feld Neue Hauptkonten die E-Mail-Adresse einer Person oder Gruppe ein, die Zugriff auf die Spalte benötigt.
- Wählen Sie die erforderlichen Rollen aus und klicken Sie auf Speichern.
- Klicken Sie auf Speichern.
Klicken Sie auf Erstellen.
Attributspeicher-Ressourcen aktualisieren
Taxonomiedetails aktualisieren
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Klicken Sie auf die Taxonomie, die Sie aktualisieren möchten.
Klicken Sie auf Bearbeiten.
Bearbeiten Sie den Taxonomienamen und die zugehörige Beschreibung nach Bedarf.
Klicken Sie auf Senden.
Attributdetails aktualisieren
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Klicken Sie auf die Taxonomie, die das Attribut enthält, das Sie aktualisieren möchten.
Klicken Sie auf das Attribut, das Sie aktualisieren möchten.
Klicken Sie auf Bearbeiten, um den Attributnamen und die Beschreibung zu aktualisieren.
- Wenn Sie ein übergeordnetes Attribut aktualisieren, können Sie es in ein untergeordnetes Attribut ändern und umgekehrt. Wählen Sie die Optionen entsprechend aus.
- Bearbeiten Sie den Attributnamen und die Beschreibung nach Bedarf.
- Klicken Sie auf Aktualisieren.
Klicken Sie unter Ressourcenspezifikationen auf
, um die Ressourcenspezifikationen für das Attribut zu aktualisieren.So fügen Sie ein neues Hauptkonto hinzu:
- Klicken Sie auf Hinzufügen.
- Geben Sie im Feld Neue Hauptkonten die E-Mail-Adresse einer Person oder Gruppe ein, die Zugriff auf die Ressource benötigt.
- Wählen Sie die erforderlichen Rollen aus.
- Klicken Sie auf Speichern.
So aktualisieren Sie ein vorhandenes Hauptkonto:
- Klicken Sie für das Hauptkonto, das Sie aktualisieren möchten, auf .
- Wählen Sie die erforderlichen Rollen aus.
- Klicken Sie auf Speichern.
So entfernen Sie ein vorhandenes Hauptkonto:
- Wählen Sie das Hauptkonto aus, das Sie entfernen möchten.
- Klicken Sie auf Entfernen.
Klicken Sie unter Spaltenspezifikationen auf
, um die Spaltenspezifikationen für das Attribut zu aktualisieren.So fügen Sie ein neues Hauptkonto hinzu:
- Klicken Sie auf Hinzufügen.
- Geben Sie im Feld Neue Hauptkonten die E-Mail-Adresse einer Person oder Gruppe ein, die Zugriff auf die Spalte benötigt.
- Wählen Sie die erforderlichen Rollen aus.
- Klicken Sie auf Speichern.
So aktualisieren Sie ein vorhandenes Hauptkonto:
- Klicken Sie für das Hauptkonto, das Sie aktualisieren möchten, auf .
- Wählen Sie die erforderlichen Rollen aus.
- Klicken Sie auf Speichern.
So entfernen Sie ein vorhandenes Hauptkonto:
- Wählen Sie das Hauptkonto aus, das Sie entfernen möchten.
- Klicken Sie auf Entfernen.
Attribute mit Ressourcen verknüpfen
Attribut mit einer Tabelle verknüpfen
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Klicken Sie auf die Taxonomie, die das Attribut enthält.
Klicken Sie auf das Attribut, mit dem Sie eine Tabelle verknüpfen möchten.
Klicken Sie auf den Tab Ressourcen.
Klicken Sie auf Ressourcen hinzufügen.
Wählen Sie eine Tabelle aus der Liste aus.
Klicken Sie auf Auswählen.
Attribut mit einer Spalte verknüpfen
Rufen Sie in der Google Cloud Console die Dataplex-Seite Attributspeicher auf.
Wählen Sie die Tabelle aus, der Sie ein Attribut mit einer Spalte verknüpfen möchten.
Klicken Sie auf den Tab Schema und Spalten-Tags.
Klicken Sie in den Richtlinien-Tags der Spalte, mit der Sie ein Attribut verknüpfen möchten, auf
.Wählen Sie die Taxonomie aus, die das Attribut enthält.
Wählen Sie das Attribut aus.
Klicken Sie auf Anhängen.
Nächste Schritte
- Weitere Informationen zur Dataplex-Sicherheit
- Weitere Informationen zur Richtlinienverwaltung in Dataplex
- Weitere Informationen zu Dataplex-IAM-Rollen