Kurzanleitung: Lakes erstellen
Auf dieser Seite werden die ersten Schritte mit Dataplex in der Google Cloud Console beschrieben. Sie erfahren, wie Sie einen Lake erstellen, eine Zone hinzufügen und ein Asset anhängen.
Hinweis
- Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery und Cloud Storage APIs aktivieren.
-
Prüfen Sie, ob Sie die folgenden Rollen für das Projekt haben: roles/dataplex.admin, roles/dataplex.editor
Auf Rollen prüfen
-
Öffnen Sie in der Google Cloud Console die Seite IAM.
IAM aufrufen - Wählen Sie das Projekt aus.
-
Suchen Sie in der Spalte Hauptkonto die Zeile mit Ihrer E-Mail-Adresse.
Ist Ihre E-Mail-Adresse nicht in dieser Spalte enthalten, haben Sie keine Rollen.
- Prüfen Sie in der Spalte Rolle der Zeile mit Ihrer E-Mail-Adresse, ob die Liste der Rollen die erforderlichen Rollen enthält.
Rollen zuweisen
-
Öffnen Sie in der Google Cloud Console die Seite IAM.
IAM aufrufen - Wählen Sie das Projekt aus.
- Klicken Sie auf Zugriff erlauben.
- Geben Sie in das Feld Neue Hauptkonten Ihre E-Mail-Adresse ein.
- Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
- Wenn Sie weitere Rollen hinzufügen möchten, klicken Sie auf Weitere Rolle hinzufügen und fügen Sie weitere Rollen hinzu.
- Klicken Sie auf Speichern.
-
-
Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery und Cloud Storage APIs aktivieren.
-
Prüfen Sie, ob Sie die folgenden Rollen für das Projekt haben: roles/dataplex.admin, roles/dataplex.editor
Auf Rollen prüfen
-
Öffnen Sie in der Google Cloud Console die Seite IAM.
IAM aufrufen - Wählen Sie das Projekt aus.
-
Suchen Sie in der Spalte Hauptkonto die Zeile mit Ihrer E-Mail-Adresse.
Ist Ihre E-Mail-Adresse nicht in dieser Spalte enthalten, haben Sie keine Rollen.
- Prüfen Sie in der Spalte Rolle der Zeile mit Ihrer E-Mail-Adresse, ob die Liste der Rollen die erforderlichen Rollen enthält.
Rollen zuweisen
-
Öffnen Sie in der Google Cloud Console die Seite IAM.
IAM aufrufen - Wählen Sie das Projekt aus.
- Klicken Sie auf Zugriff erlauben.
- Geben Sie in das Feld Neue Hauptkonten Ihre E-Mail-Adresse ein.
- Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
- Wenn Sie weitere Rollen hinzufügen möchten, klicken Sie auf Weitere Rolle hinzufügen und fügen Sie weitere Rollen hinzu.
- Klicken Sie auf Speichern.
-
- Cloud Storage-Bucket erstellen:
- Wechseln Sie in der Google Cloud Console zur Cloud Storage-Seite Buckets.
- Klicken Sie auf Bucket erstellen.
- Geben Sie auf der Seite Bucket erstellen die Bucket-Informationen ein. Klicken Sie auf Weiter, um mit dem nächsten Schritt fortzufahren.
- Geben Sie unter Bucket benennen einen eindeutigen Bucket-Namen ein. Der Bucket-Name darf keine vertraulichen Informationen enthalten, da der Bucket-Namespace global und öffentlich sichtbar ist.
-
Gehen Sie unter Speicherort für Daten auswählen folgendermaßen vor:
- Wählen Sie eine Option für Standorttyp aus.
- Wählen Sie eine Standort-Option aus.
- Wählen Sie unter Standardspeicherklasse für Ihre Daten auswählen Folgendes aus: Standard.
- Wählen Sie unter Zugriffssteuerung für Objekte auswählen eine Option für die Zugriffssteuerung aus.
- Geben Sie für Erweiterte Einstellungen (optional) eine Verschlüsselungsmethode, eine Aufbewahrungsrichtlinie oder Bucket-Labels an.
- Klicken Sie auf Erstellen.
Lakes erstellen
Die folgenden Schritte zeigen, wie Sie einen Lake mit der Google Cloud Console erstellen.
Rufen Sie in der Google Cloud Console Dataplex auf.
Rufen Sie die Ansicht Verwalten auf.
Klicken Sie auf
Erstellen.Geben Sie einen Anzeigenamen ein.
Die Lake-ID wird automatisch für Sie generiert.
Geben Sie die Region an, in der die Instanz erstellt werden soll.
Bei Lakes, die in einer bestimmten Region erstellt wurden (z. B.
us-central1
), können sowohl Daten mit einer einzelnen Region (us-central1
) als auch Daten mit mehreren Regionen (us multi-region
) abhängig von den Zoneneinstellungen angehängt werden.Klicken Sie auf Erstellen.
Zone zu Ihrem Lake hinzufügen
Nachdem Sie den Lake erstellt haben, können Sie ihm Zonen hinzufügen. Zonen sind logische Gruppierungen von unstrukturierten und strukturierten Daten.
Klicken Sie in der Ansicht Verwalten auf den Namen des Lakes, dem Sie eine Zone hinzufügen möchten.
Klicken Sie auf
Zone hinzufügen.Geben Sie einen Anzeigenamen für die Zone ein.
Klicken Sie auf das Drop-down-Menü Typ. Wählen Sie Rohzone oder Ausgewählte Zone aus. Weitere Informationen zu den Zonentypen
Wählen Sie unter Speicherorte für Daten entweder Regional oder Multiregional aus. Ihre Auswahl kann später nicht mehr geändert werden. Daten einer einzelnen Region und mehrerer Regionen können nicht in derselben Zone gemischt werden.
Klicken Sie auf Erstellen.
Das Erstellen der Zone kann einige Minuten dauern.
Asset anhängen
Daten können in Cloud Storage-Buckets oder BigQuery-Datasets gespeichert und als Assets an Datenzonen innerhalb eines Dataplex-Lakes angehängt werden.
Führen Sie die folgenden Schritte aus, um den Cloud Storage-Bucket anzuhängen, den Sie zuvor als Asset erstellt haben.
Klicken Sie in der Ansicht Verwalten auf den Namen des Lakes, an den Sie einen Cloud Storage-Bucket anhängen möchten.
Klicken Sie auf dem Tab Zonen auf die Zone, der Sie das Asset hinzufügen möchten.
Klicken Sie auf dem Tab Assets auf
Assets hinzufügen.Klicken Sie auf Asset hinzufügen.
Wählen Sie unter Typ die Option Storage-Bucket aus.
Geben Sie unter Anzeigename einen Namen für das Asset ein.
Klicken Sie im Feld Bucket auf Durchsuchen. Wenn Sie einen Cloud Storage-Bucket haben, suchen Sie ihn und klicken Sie auf Auswählen. Wenn Sie keinen Cloud Storage-Bucket haben, können Sie einen erstellen, indem Sie auf die Schaltfläche
klicken.Geben Sie einen eindeutigen Namen für den Bucket ein. Klicken Sie auf Weiter.
Wählen Sie einen Standorttyp aus. Klicken Sie auf Weiter.
Wählen Sie eine Standardspeicherklasse für Ihre Daten aus. Klicken Sie auf Weiter.
Wählen Sie eine Zugriffssteuerungsebene aus. Klicken Sie auf Weiter.
Wählen Sie eine Datenschutzoption oder Keine aus. Klicken Sie auf Weiter.
Klicken Sie auf Erstellen.
Klicken Sie auf Auswählen.
Klicken Sie auf Fertig.
Klicken Sie auf Weiter.
Wählen Sie unter Discovery-Einstellungen die Option Übernehmen aus, um die Discovery-Einstellungen von der Zonenebene zu übernehmen.
Klicken Sie auf Weiter.
Klicken Sie unter Assets hinzufügen auf Senden.
Warten Sie, bis das Asset erstellt wurde.
Bereinigen
So vermeiden Sie, dass Ihrem Google Cloud-Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
- Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.
- Wenn das Projekt, das Sie löschen möchten, an eine Organisation geknüpft ist, maximieren Sie in der Spalte Name die Liste Organisation.
- Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.
Alternativ können Sie die in dieser Anleitung verwendeten Ressourcen löschen. Lakes können nur gelöscht werden, wenn alle zugehörigen Datenzonenressourcen gelöscht wurden. Ebenso können Datenzonen nur gelöscht werden, wenn alle zugehörigen Asset-Ressourcen gelöscht wurden:
Storage-Bucket trennen
In den folgenden Schritten wird gezeigt, wie Sie das von Ihnen erstellte Dataplex-Asset trennen.
Rufen Sie in der Google Cloud Console Dataplex auf.
Klicken Sie in der Ansicht Verwalten auf den Namen des von Ihnen erstellten Lakes.
Klicken Sie auf dem Tab Zonen auf den Namen der von Ihnen erstellten Zone.
Wählen Sie auf dem Tab Assets das zu trennende Asset aus. Klicken Sie dazu auf das Kästchen links neben dem Bucket-Namen.
Klicken Sie auf Asset löschen.
Klicken Sie auf Löschen, um das Trennen zu bestätigen.
Bereich löschen
In den folgenden Schritten wird gezeigt, wie Sie die von Ihnen erstellte Dataplex-Zone löschen.
Rufen Sie in der Google Cloud Console Dataplex auf.
Klicken Sie in der Ansicht Verwalten auf den von Ihnen erstellten Lake.
Wählen Sie auf dem Tab Zonen die Zone aus, die Sie löschen möchten. Klicken Sie dazu auf das Kästchen links neben dem Namen der Datenzone.
Klicken Sie auf Zone löschen.
Klicken Sie zur Bestätigung noch einmal auf Löschen.
Lake löschen
In den folgenden Schritten wird gezeigt, wie Sie den von Ihnen erstellten Dataplex-See löschen.
Rufen Sie in der Google Cloud Console Dataplex auf.
Klicken Sie in der Ansicht Verwalten auf den von Ihnen erstellten Lake.
Klicken Sie oben auf der Seite auf Löschen.
Bestätigen Sie das Löschen, indem Sie „delete“ in das Textfeld eingeben.
Klicken Sie zum Bestätigen auf Lake löschen.
Nächste Schritte
Nachdem Sie den Lake, die Zonen und die Assets erstellt haben, können Sie: