In diesem Dokument wird beschrieben, wie Sie den Zugriff auf Dataplex-Lakes sichern und verwalten.
Mit dem Dataplex-Sicherheitsmodell können Sie die Berechtigungen von Nutzern für die folgenden Aufgaben verwalten:
- Lake verwalten (Assets, Zonen und zusätzliche Lakes erstellen und anhängen)
- Zugriff auf Daten, die über das Zuordnungs-Asset mit einem Data Lake verbunden sind (z. B.Google Cloud Ressourcen wie Cloud Storage-Buckets und BigQuery-Datasets)
- Auf Metadaten zu den mit einem Data Lake verbundenen Daten zugreifen
Ein Administrator für einen Lake steuert den Zugriff auf Dataplex-Ressourcen wie Lake, Zone und Assets, indem er die grundlegenden und vordefinierten Rollen gewährt.
Einfache Rollen
Rolle | Beschreibung |
---|---|
Dataplex-Betrachter ( roles/dataplex.viewer ) |
Sie können den Datensee und seine konfigurierten Zonen und Assets aufrufen, aber nicht bearbeiten. |
Dataplex-Bearbeiter ( roles/dataplex.editor ) |
Berechtigung zum Bearbeiten des Sees Darf Datenspeicher, Zonen, Assets und Aufgaben erstellen und konfigurieren. |
Dataplex-Administrator ( roles/dataplex.administrator ) |
Vollständige Verwaltung eines Datensees |
Dataplex-Entwickler ( roles/dataplex.developer ) |
Möglichkeit, Arbeitslasten zur Datenanalyse in einem Lake auszuführen. * |
Wenn Sie einen Spark-Job ausführen möchten, erstellen Sie Dataproc-Cluster und reichen Sie Dataproc-Jobs in dem Projekt ein, dem die Rechenleistung zugeordnet werden soll.
Vordefinierte Rollen
Google Cloud verwaltet die vordefinierten Rollen, die einen detaillierten Zugriff auf Dataplex ermöglichen.
Metadatenrollen
Nutzer mit Metadatenrollen können Metadaten wie Tabellenschemata aufrufen.
Rolle | Beschreibung |
---|---|
Autor von Dataplex-Metadaten ( roles/dataplex.metadataWriter ) |
Möglichkeit, die Metadaten einer bestimmten Ressource zu aktualisieren. |
Dataplex-Metadatenleser ( roles/dataplex.metadataReader ) |
Lesen der Metadaten (z. B. zum Abfragen einer Tabelle) |
Datenrollen
Wenn Sie einem Hauptkonto Datenrollen zuweisen, kann es Daten in den zugrunde liegenden Ressourcen lesen oder schreiben, auf die die Assets des Data Lake verweisen.
Dataplex ordnet seine Rollen den Datenrollen für jede zugrunde liegende Speicherressource zu, z. B. Cloud Storage und BigQuery.
Dataplex übersetzt und überträgt Dataplex-Datenrollen an die zugrunde liegende Speicherressource und legt die richtigen Rollen für jede Speicherressource fest. Sie können eine einzelne Dataplex-Datenrolle auf Ebene der Data Lake-Hierarchie (z. B. eines Data Lake) gewähren. Dataplex verwaltet dann den angegebenen Zugriff auf Daten in allen mit diesem Data Lake verbundenen Ressourcen. Beispielsweise werden Cloud Storage-Buckets und BigQuery-Datasets von Assets in den zugrunde liegenden Zonen referenziert.
Wenn Sie einem Hauptkonto beispielsweise die Rolle dataplex.dataWriter
für einen Lake zuweisen, erhält es Schreibzugriff auf alle Daten im Lake sowie auf die zugrunde liegenden Zonen und Assets. Rollen für den Datenzugriff, die auf einer niedrigeren Ebene (Zone) gewährt werden, werden in der Lake-Hierarchie an die zugrunde liegenden Assets vererbt.
Rolle | Beschreibung |
---|---|
Dataplex-Datenleser ( roles/dataplex.dataReader ) |
Möglichkeit, Daten aus mit Assets verknüpften Speichern zu lesen, einschließlich Speicher-Buckets und BigQuery-Datasets (und deren Inhalt). * |
Dataplex-Datenautor ( roles/dataplex.dataWriter ) |
Schreibberechtigung für die zugrunde liegenden Ressourcen, auf die das Asset verweist. * |
Dataplex-Dateninhaber ( roles/dataplex.dataOwner ) |
Gewährt den zugrunde liegenden Ressourcen die Rolle „Inhaber“, einschließlich der Möglichkeit, untergeordnete Ressourcen zu verwalten. Als Dateninhaber eines BigQuery-Datasets können Sie beispielsweise die zugrunde liegenden Tabellen verwalten. |
Lakes schützen
Sie können den Zugriff auf Ihren Data Lake und die zugehörigen Daten schützen und verwalten. Verwenden Sie in der Google Cloud Console eine der folgenden Ansichten:
- Die Dataplex-Ansicht Verwalten auf dem Tab Berechtigungen
- Die Dataplex-Ansicht Sicher
In der Ansicht Verwalten
Auf dem Tab Berechtigungen können Sie alle Berechtigungen für eine Datenseeressource verwalten. Außerdem wird eine ungefilterte Ansicht aller Berechtigungen angezeigt, einschließlich der übernommenen.
So sichern Sie Ihren See:
Rufen Sie in der Google Cloud Console „Dataplex“ auf.
Rufen Sie die Ansicht Verwalten auf.
Klicken Sie auf den Namen des von Ihnen erstellten Sees.
Klicken Sie auf den Tab Berechtigungen.
Klicken Sie auf den Tab Nach Rollen filtern.
Klicken Sie auf Hinzufügen, um eine neue Rolle hinzuzufügen. Fügen Sie die Rollen Dataplex Data Reader, Data Writer und Data Owner hinzu.
Prüfen Sie, ob die Rollen Dataplex Data Reader, Data Writer und Data Owner angezeigt werden.
Ansicht Sicher verwenden
Die Dataplex-Ansicht Sicher in der Google Cloud Console bietet Folgendes:
- Eine filterbare Ansicht, die nur die Dataplex-Rollen enthält, die sich auf eine bestimmte Ressource beziehen
- Datenrollen von Rollen für Data Lake-Ressourcen trennen


- Ein Dienstkonto, das die Rolle „Dataplex-Administrator“ vom Projekt erbt.
- Hauptkonten (E-Mail-Adresse), die die Rollen „Dataplex-Bearbeiter“ und „Dataplex-Betrachter“ vom Projekt übernehmen. Diese Rollen gelten für alle Ressourcen.
- Ein Hauptkonto (E-Mail-Adresse), das die Rolle „Dataplex-Administrator“ vom Projekt übernimmt.
Richtlinienverwaltung
Nachdem Sie die Sicherheitsrichtlinie angegeben haben, überträgt Dataplex die Berechtigungen an die IAM-Richtlinien der verwalteten Ressourcen.
Die auf Ebene des Datensees konfigurierte Sicherheitsrichtlinie wird auf alle in diesem Datensee verwalteten Ressourcen angewendet. In Dataplex finden Sie auf dem Tab Verwalten > Berechtigungen den Status der Übertragung und Informationen zu diesen Übertragungen im großen Maßstab. Er überwacht die verwalteten Ressourcen kontinuierlich auf Änderungen an der IAM-Richtlinie außerhalb von Dataplex.
Nutzer, die bereits Berechtigungen für eine Ressource haben, behalten diese auch, nachdem die Ressource einem Dataplex-Datensee zugeordnet wurde. Ebenso bleiben Rollenbindungen, die nicht zu Dataplex gehören und nach dem Anhängen der Ressource an Dataplex erstellt oder aktualisiert werden, unverändert.
Richtlinien auf Spalten-, Zeilen- und Tabellenebene festlegen
Cloud Storage-Bucket-Assets sind mit externen BigQuery-Tabellen verknüpft.
Sie können ein Cloud Storage-Bucket-Asset aktualisieren. Das bedeutet, dass Dataplex die angehängten externen Tabellen entfernt und stattdessen BigLake-Tabellen anhängt.
Sie können BigLake-Tabellen anstelle von externen Tabellen verwenden, um eine detaillierte Zugriffssteuerung zu ermöglichen, einschließlich Einstellungen auf Zeilenebene, Einstellungen auf Spaltenebene und Spaltendatenmaskierung.
Metadatensicherheit
Metadaten beziehen sich hauptsächlich auf Schemainformationen, die mit Nutzerdaten in Ressourcen verknüpft sind, die von einem Data Lake verwaltet werden.
Dataplex Discovery untersucht die Daten in verwalteten Ressourcen und extrahiert tabellarische Schemainformationen. Diese Tabellen werden in BigQuery, Dataproc Metastore und Data Catalog veröffentlicht.
BigQuery
Jede gefundene Tabelle ist mit einer in BigQuery registrierten Tabelle verknüpft. Jede Zone ist mit einem BigQuery-Dataset verknüpft, unter dem alle externen Tabellen registriert sind, die mit Tabellen verknüpft sind, die in dieser Datenzone gefunden wurden.
Die gefundenen in Cloud Storage gehosteten Tabellen werden unter dem Datensatz registriert, der für die Zone erstellt wurde.
Dataproc Metastore
Datenbanken und Tabellen werden im Dataproc Metastore verfügbar gemacht, der mit der Data Lake-Instanz von Dataplex verknüpft ist. Jede Datenzone ist mit einer Datenbank verknüpft und jedes Asset kann eine oder mehrere verknüpfte Tabellen haben.
Die Daten in einem Dataproc Metastore-Dienst werden durch die Konfiguration Ihres VPC-SC-Netzwerks geschützt. Die Dataproc Metastore-Instanz wird Dataplex beim Erstellen des Data Lake zur Verfügung gestellt. Sie ist also bereits eine nutzerverwaltete Ressource.
Data Catalog
Jede erkannte Tabelle hat einen zugehörigen Eintrag im Data Catalog, um die Suche und Entdeckung zu ermöglichen.
Für das Erstellen von Einträgen im Data Catalog sind IAM-Richtliniennamen erforderlich. Daher stellt Dataplex den Namen der IAM-Richtlinie der Dataplex-Asset-Ressource bereit, mit der der Eintrag verknüpft werden soll. Daher werden die Berechtigungen für den Dataplex-Eintrag von den Berechtigungen für die Asset-Ressource bestimmt.
Gewähren Sie der Asset-Ressource die Rolle „Dataplex Metadata Reader“ (roles/dataplex.metadataReader
) und die Rolle „Dataplex Metadata Writer“ (roles/dataplex.metadataWriter
).
Nächste Schritte
- Weitere Informationen zu Dataplex IAM
- Weitere Informationen zu Dataplex-IAM-Rollen
- Weitere Informationen zu Dataplex-IAM-Berechtigungen