Entwicklungsumgebungen erstellen
In dieser Kurzanleitung werden Sie durch die Schritte zum Erstellen individueller Entwicklungsumgebungen in Dataform geführt, damit jeder Entwickler in seiner eigenen Entwicklungsumgebung arbeiten kann:
- Dataform-Repository erstellen
Dataform Zugriff auf BigQuery gewähren
Konfigurieren Sie Überschreibungen von Kompilierungen, die Dataform auf alle Arbeitsbereiche in Ihrem Repository anwendet und so Arbeitsbereiche in isolierte Entwicklungsumgebungen umwandelt.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
Dataform-Administrator (
roles/dataform.admin
) – Repositories -
Dataform Editor (
roles/dataform.editor
) – Arbeitsbereiche und Workflow-Aufrufe Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
Repository erstellen.Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:
Geben Sie im Feld Repository-ID den Wert
quickstart-dev
ein.Wählen Sie in der Liste Region
europe-west4
aus.Klicken Sie auf Erstellen.
Klicken Sie auf Fertig.
- BigQuery-Dateneditor für Projekte, für die Dataform sowohl Lese- als auch Schreibzugriff benötigt. Sie enthalten in der Regel das Projekt, in dem Ihr Dataform-Repository gehostet wird.
- BigQuery Data Viewer für Projekte, für die Dataform schreibgeschützten Zugriff benötigt.
- BigQuery-Jobnutzer für das Projekt, in dem Ihr Dataform-Repository gehostet wird.
Rufen Sie in der Google Cloud Console die Seite IAM auf.
Klicken Sie auf Hinzufügen.
Geben Sie im Feld Neue Hauptkonten die ID Ihres Dataform-Dienstkontos oder die E-Mail-Adresse Ihres Google-Kontos ein (Vorschau).
Wählen Sie im Menü Rolle auswählen die Rolle BigQuery-Jobnutzer aus.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie dann im Menü Rolle auswählen die Rolle BigQuery-Dateneditor aus.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie dann im Menü Rolle auswählen die Rolle BigQuery-Datenbetrachter aus.
Klicken Sie auf Speichern.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-dev
.Klicken Sie auf Einstellungen und dann auf Bearbeiten
Geben Sie im Bereich Überschreibungen von Arbeitsbereichskompilierungen im Feld Schema-Suffix den Wert
${workspaceName}
ein.Wenn Sie die Ausführung in einem Arbeitsbereich auslösen, hängt Dataform den Namen des Arbeitsbereichs als Suffix an das in den Workflow-Einstellungen festgelegte Standardschema an. In dieser Kurzanleitung werden die Dataform-Standardeinstellungen mit dem Standardschema
dataform
verwendet.Klicken Sie auf Speichern.
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und wählen Sie ein Dataset aus.
Klicken Sie auf das Menü
Aktionen und wählen Sie Löschen aus.Geben Sie im Dialogfeld Dataset löschen den Wert
delete
in das Feld ein und klicken Sie auf Löschen.Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie neben
quickstart-dev
auf das Menü Mehr und wählen Sie Löschen aus.- Geben Sie im Fenster Repository löschen den Namen des Repositorys ein, um das Löschen zu bestätigen.
Klicken Sie zur Bestätigung auf Löschen.
Weitere Informationen zum Code-Lebenszyklus in Dataform finden Sie unter Einführung in den Code-Lebenszyklus in Dataform.
Weitere Informationen zu Best Practices für den Workflow-Lebenszyklus in Dataform finden Sie unter Best Practices für den Workflow-Lebenszyklus.
Weitere Informationen zu Überschreibungen von Arbeitsbereichskompilierungen in Dataform
Informationen zum Planen von Produktionsausführungen in Dataform finden Sie unter Produktionsausführungen planen.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Ausführen aller Aufgaben in dieser Anleitung benötigen:
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Dataform-Repository erstellen
Dataform Zugriff auf BigQuery gewähren
Damit Workflows in BigQuery ausgeführt werden können, muss das Dataform-Dienstkonto oder Ihr Google-Konto (Vorschau) die folgenden erforderlichen Rollen haben:
So weisen Sie diese Rollen zu:
Kompilierungsüberschreibungen für Arbeitsbereiche konfigurieren
So erstellen Sie isolierte Entwicklungsumgebungen mit Überschreibungen von Dataform-Arbeitsbereichskompilierungen:
Dataform wendet Überschreibungen von Arbeitsbereichskompilierungen auf alle Arbeitsbereiche in Ihrem Repository an.
Wenn Sie einen Workflow in einem Arbeitsbereich manuell ausführen, wird er mit Überschreibungen von Arbeitsbereichskompilierungen ausgeführt.
Dataform führt den Workflow also im dataform_workspaceName
-Schema in BigQuery aus und wandelt den Arbeitsbereich in eine isolierte Entwicklungsumgebung um.
Wenn Sie beispielsweise die Ausführung in einem sasha
-Arbeitsbereich manuell auslösen, führt Dataform Ihren Workflow im Schema dataform_sasha
in BigQuery aus.
Wenn Sie Workflows ohne Überschreibungen von Arbeitsbereichskompilierungen ausführen, aber die Überschreibungen von Arbeitsbereichskompilierungen für Entwicklungsumgebungen beibehalten möchten, können Sie Releasekonfigurationen erstellen, um andere Ausführungsumgebungen zu konfigurieren, z. B. staging
und production
.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
In BigQuery erstellte Datasets löschen
Löschen Sie Datasets mit Namen, die mit dataform
beginnen, z. B. dataform-sasha
, damit keine Gebühren für BigQuery-Assets anfallen.
Dataform-Repository löschen
Für das Erstellen von Dataform-Repositories fallen keine Kosten an. Möchten Sie dennoch ein Repository und seinen Inhalt löschen, gehen Sie so vor: