Produktionsausführungen planen
In dieser Kurzanleitung werden Sie durch die folgenden Schritte zum Planen von Produktionsausführungen in Dataform geführt:
- Erstellen Sie ein Dataform-Repository.
- Dataform Zugriff auf BigQuery gewähren
Erstellen Sie eine Releasekonfiguration, um die Produktionsumgebung zu konfigurieren.
Erstellen Sie eine
production
-Releasekonfiguration mit der Häufigkeit, mit derproduction
-Kompilierungsergebnisse erstellt werden.Workflowkonfiguration zum Planen von Ausführungen in der Produktionsumgebung erstellen
Erstellen Sie eine
production
-Workflowkonfiguration, wählen Sie die Releasekonfigurationproduction
aus und legen Sie einen Zeitplan für die Ausführung derproduction
-Kompilierungsergebnisse fest.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Enable the BigQuery and Dataform APIs.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren, damit Sie die Berechtigungen erhalten, die Sie zum Ausführen aller Aufgaben in dieser Anleitung benötigen:
-
Dataform Admin (
roles/dataform.admin
) für Repositories -
Dataform Editor (
roles/dataform.editor
) für Arbeitsbereiche und WorkflowInvocations
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.
Möglicherweise können Sie die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Dataform-Repository erstellen
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
Repository erstellen.Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:
Geben Sie im Feld Repository-ID den Wert
quickstart-production
ein.Wählen Sie in der Liste Region
europe-west4
aus.Klicken Sie auf Erstellen.
Klicken Sie auf Fertig.
Dataform Zugriff auf BigQuery gewähren
Zum Ausführen von Workflows in BigQuery muss das Dataform-Dienstkonto die folgenden erforderlichen Rollen haben:
- BigQuery-Dateneditor für Projekte, für die Dataform Lese- und Schreibzugriff benötigt. Sie enthalten in der Regel das Projekt, in dem Ihr Dataform-Repository gehostet wird.
- BigQuery Data Viewer für Projekte, auf die Dataform Lesezugriff benötigt.
- BigQuery Job User in dem Projekt, in dem Ihr Dataform-Repository gehostet wird.
So weisen Sie diese Rollen zu:
Öffnen Sie in der Google Cloud Console die Seite IAM.
Klicken Sie auf Hinzufügen.
Geben Sie im Feld Neue Hauptkonten Ihre Dataform-Dienstkonto-ID ein.
Wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery-Jobnutzer aus.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery-Datenbearbeiter aus.
Klicken Sie auf Weitere Rolle hinzufügen und wählen Sie in der Drop-down-Liste Rolle auswählen die Rolle BigQuery-Datenbetrachter aus.
Klicken Sie auf Speichern.
Releasekonfiguration erstellen
So erstellen Sie Ergebnisse der Produktionskompilierung des Repositorys quickstart-production
:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production
.Klicken Sie auf Release-Konfigurationen und dann auf Neue Releasekonfiguration.
Konfigurieren Sie im Bereich Releasekonfiguration erstellen die folgenden Einstellungen:
Geben Sie im Feld Release-ID den Wert
production
ein.Übernehmen Sie im Feld Git commitish den Standardwert
main
.Wählen Sie im Drop-down-Menü Häufigkeit die Option Benutzerdefiniert aus.
Geben Sie im Feld Benutzerdefinierter Zeitplan
0 16 * * *
ein.Wählen Sie im Drop-down-Menü Zeitzone eine UTC+1-Zeitzone aus, z. B. Greenwich Mean Time (GMT).
Dataform kompiliert jeden Tag um 16:00 Uhr UTC+1 das Repository
quickstart-production
und wendet die in dieser Releasekonfiguration konfigurierten Kompilierungseinstellungen an, um die Kompilierungsergebnisseproduction
zu erstellen.Klicken Sie auf Erstellen.
Die Releasekonfiguration production
erstellt täglich um 16:00 Uhr UTC+1 ein Kompilierungsergebnis des gesamten quickstart-production
-Repositorys.
Workflowkonfiguration erstellen
So planen Sie die Ausführung von production
-Tabellen:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production
.Klicken Sie auf Workflowkonfigurationen und dann auf Neue Workflowkonfiguration.
Geben Sie im Bereich Workflowkonfiguration erstellen im Feld Konfigurations-ID den Wert
production
ein.Wählen Sie im Drop-down-Menü Release-Konfiguration die Option
production
aus.Geben Sie im Feld Häufigkeit den Wert
0 17 * * *
ein.Wählen Sie im Drop-down-Menü Zeitzone eine UTC+1-Zeitzone aus, z. B. Greenwich Mean Time (GMT).
Dataform führt jeden Tag um 17:00 Uhr UTC+1 das letzte
production
-Kompilierungsergebnis des Repositorysquickstart-production
aus.Damit Dataform das letzte Kompilierungsergebnis in der entsprechenden Releasekonfiguration ausführt, muss zwischen dem Zeitpunkt der Erstellung des Kompilierungsergebnisses und der geplanten Ausführung eine Pause von mindestens einer Stunde eingehalten werden.
Klicken Sie auf Alle Aktionen.
Dataform führt alle SQL-Workflowaktionen im Kompilierungsergebnis
production
aus.Klicken Sie auf Erstellen.
Die Workflowkonfiguration production
führt jeden Tag um 16:00 Uhr (UTC+1) das gesamte neueste Kompilierungsergebnis aus, das von der production
-Releasekonfiguration erstellt wurde.
Frühere Kompilierungsergebnisse von production
ansehen
So rufen Sie frühere geplante Kompilierungsergebnisse für production
auf:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production
.Klicken Sie auf Releasekonfigurationen.
Klicken Sie auf
production
.
Frühere production
Workflowausführungen ansehen
So rufen Sie frühere production
-Workflowausführungen auf:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production
.Klicken Sie auf Workflowkonfigurationen.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden.
In BigQuery erstelltes Dataset löschen
So löschen Sie das Dataset dataform_production
, um Gebühren für BigQuery-Assets zu vermeiden:
Öffnen Sie in der Google Cloud Console die Seite BigQuery.
Maximieren Sie im Bereich Explorer Ihr Projekt und wählen Sie
dataform_production
aus.Klicken Sie auf das Menü
Aktionen und wählen Sie Löschen aus.Geben Sie im Dialogfeld Dataset löschen delete ein und klicken Sie dann auf Löschen.
Dataform-Releasekonfiguration löschen
Für das Erstellen von Dataform-Releasekonfigurationen fallen keine Kosten an. Wenn Sie jedoch die Releasekonfiguration production
löschen möchten, gehen Sie so vor:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production
.Klicken Sie auf Releasekonfigurationen.
Klicken Sie in der Releasekonfiguration
production
auf das -Dreipunkt-Menü und dann auf Löschen.Klicken Sie im Dialogfeld Releasekonfiguration löschen auf Löschen.
Dataform-Workflowkonfiguration löschen
Führen Sie die folgenden Schritte aus, um die Workflowkonfiguration der Dataform-production
zu löschen und so Kosten für BigQuery-Assets zu vermeiden:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production
.Klicken Sie auf Workflowkonfigurationen.
Klicken Sie in der Workflowkonfiguration
production
auf das -Dreipunkt-Menü und dann auf Löschen.Klicken Sie im Dialogfeld Releasekonfiguration löschen auf Löschen.
Dataform-Repository löschen
Für das Erstellen von Dataform-Repositories fallen keine Kosten an. Wenn Sie jedoch ein Repository und seinen gesamten Inhalt löschen möchten, gehen Sie so vor:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie neben
quickstart-production
auf das -Menü Mehr und wählen Sie dann Löschen aus.Geben Sie im Fenster Repository löschen den Namen des Repositorys ein, um das Löschen zu bestätigen.
Klicken Sie zur Bestätigung auf Löschen.
Nächste Schritte
Weitere Informationen zum Codelebenszyklus in Dataform finden Sie unter Einführung in den Codelebenszyklus in Dataform.
Weitere Informationen zu Best Practices für den Codelebenszyklus in Dataform finden Sie unter Codelebenszyklus verwalten.
Weitere Informationen zu Releasekonfigurationen in Dataform finden Sie unter Releasekonfiguration erstellen.
Weitere Informationen zu Workflowkonfigurationen in Dataform finden Sie unter Ausführungen mit Workflowkonfigurationen planen.