Einführung in Repositories

Dieses Dokument hilft Ihnen, das Konzept der Repositories in Dataform zu verstehen.

Jedes Dataform-Repository enthält eine Sammlung von SQLX- und JavaScript-Dateien, aus denen Ihr SQL-Workflow besteht, sowie Dataform-Konfigurationsdateien und -pakete. Sie interagieren mit dem Inhalt Ihres Repositorys in einem Entwicklungsarbeitsbereich.

Dataform zeigt Ihre Repositories auf der Dataform-Seite in alphabetischer Reihenfolge der Repository-IDs an. Sie können sie sortieren und filtern.

Zu Dataform

Jedes Dataform-Repository ist mit einem Dienstkonto verbunden. Sie können ein Dienstkonto auswählen, wenn Sie ein Repository erstellen, oder das Dienstkonto später bearbeiten.

Standardmäßig verwendet Dataform ein Dienstkonto, das von Ihrer Projektnummer im folgenden Format abgeleitet wird:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform verwendet Git, um Änderungen aufzuzeichnen und Dateiversionen zu verwalten. Jedes Dataform-Repository entspricht einem Git-Repository. Nachdem Sie ein Dataform-Repository erstellt haben, können Sie es mit einem Remote-GitHub-, GitLab- oder Bitbucket-Repository verbinden.

Dataform speichert den Repository-Code in einem Dataform-Repository. In einem verbundenen Repository speichert das Drittanbieter-Repository den Repository-Code. Dataform interagiert mit dem Repository des Drittanbieters, damit Sie den Inhalt in einem Dataform-Entwicklungsarbeitsbereich bearbeiten und ausführen können.

Eine Dataform-Repository-Seite besteht aus den folgenden Komponenten:

Tab „Entwicklungsarbeitsbereiche“
Zeigt Entwicklungsarbeitsbereiche an, die im Repository erstellt wurden.
Tab „Releasekonfigurationen“
Ermöglicht das Überprüfen, Erstellen, Bearbeiten und Löschen von Releases.
Tab mit Logs zur Workflowausführung
Zeigt Ausführungsprotokolle für Dataform-Workflows an.
Tab „Workflowkonfigurationen“
Ermöglicht das Überprüfen, Erstellen, Bearbeiten und Löschen von Workflowkonfigurationen.
Tab „Einstellungen“
Zeigt den Namen und den Speicherort des Repositorys an. Bei einem Repository, das mit dem Git-Repository eines Drittanbieters verbunden ist, werden hier die Repository-Quelle des Drittanbieters, der Standardzweigname und das geheime Token angezeigt. Zeigt die Schaltflächen zum Verbinden des Repositorys mit dem Git-Repository eines Drittanbieters und zum Bearbeiten der Git-Verbindung an.
Schaltfläche „Entwicklungsarbeitsbereich erstellen“
Hier können Sie einen Entwicklungsarbeitsbereich erstellen.

Nachdem Sie einen Entwicklungsarbeitsbereich erstellt und initialisiert haben, können Sie die Datei mit den Workfloweinstellungen bearbeiten, um die folgenden Dataform-Einstellungen Ihres Repositorys zu konfigurieren:

  • Die Standarddatenbank (Google Cloud-Projekt-ID)
  • Das Standardschema (BigQuery-Dataset-ID)
  • Der BigQuery-Standardstandort
  • Das Standardschema (BigQuery-Dataset-ID) für Assertions
  • Das Warehouse, das auf bigquery festgelegt werden muss
  • Benutzerdefinierte Variablen, die dem Projektcode während der Kompilierung zur Verfügung gestellt werden

Weitere Informationen zu den Einstellungen des Dataform-Repositorys finden Sie unter IProjectConfig in der Dataform Core-Referenz.

Nächste Schritte