Einführung in Repositories

Dieses Dokument hilft Ihnen, das Konzept Repositories in Dataform.

Jedes Dataform-Repository enthält eine Sammlung von SQLX und JavaScript -Dateien, aus denen Ihr SQL-Workflow besteht, sowie Konfigurationsdateien und -paketen. Sie interagieren mit den Inhalten Ihrer in einem Entwicklungsarbeitsbereich.

Dataform zeigt Ihre Repositories auf der Dataform-Seite in alphabetischer Reihenfolge der Repository-IDs. Sie können sie sortieren und filtern.

Zu Dataform

Jedes Dataform-Repository ist mit einem Dienstkonto verbunden. Sie können Beim Erstellen eines Repositorys ein Dienstkonto auswählen oder bearbeiten Sie das Dienstkonto .

Standardmäßig verwendet Dataform ein Dienstkonto, das aus Ihrem Projektnummer im folgenden Format:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform verwendet Git, um Änderungen aufzuzeichnen und Dateiversionen zu verwalten. Jedes Dataform-Repository entspricht einem Git-Repository. Nachdem Sie ein Dataform-Repository erstellt haben, können Sie es verbinden in ein Remote-Repository auf GitHub, GitLab oder Bitbucket übertragen.

Dataform speichert den Repository-Code in einem Dataform-Repository. In einem verbundenen Repository speichert das Drittanbieter-Repository den Repository-Code. Dataform interagiert mit dem Repository des Drittanbieters, damit Sie Folgendes bearbeiten können: und führen den Inhalt in einem Dataform-Entwicklungsarbeitsbereich aus.

Eine Dataform-Repository-Seite besteht aus den folgenden Komponenten:

Tab „Entwicklungsarbeitsbereiche“
Zeigt Entwicklungsarbeitsbereiche an, die im Repository erstellt wurden.
Tab „Releasekonfigurationen“
Untersuchen, erstellen, bearbeiten und löschen Releases.
Tab mit Logs zur Workflowausführung
Zeigt Ausführungsprotokolle für Dataform-Workflows an.
Tab „Workflowkonfigurationen“
Sehen, erstellen, bearbeiten und löschen Workflowkonfigurationen
Tab „Einstellungen“
Zeigt den Namen und den Speicherort des Repositorys an. Für ein verbundenes Repository Drittanbieter-Git-Repository, zeigt die Repository-Quelle des Drittanbieters an, Standardzweigname und geheimem Token. Zeigt die Schaltflächen an, Repository mit einem Drittanbieter verbinden Git-Repository und die Git-Verbindung bearbeiten.
Schaltfläche „Entwicklungsarbeitsbereich erstellen“
Hier können Sie einen Entwicklungsarbeitsbereich erstellen.

Nachdem Sie einen Entwicklungsarbeitsbereich erstellt und initialisiert haben, können Sie Datei mit Workfloweinstellungen bearbeiten, um die folgenden Dataform-Einstellungen Ihres Repositorys:

  • Die Standarddatenbank (Google Cloud-Projekt-ID)
  • Das Standardschema (BigQuery-Dataset-ID)
  • Der BigQuery-Standardstandort
  • Das Standardschema (BigQuery-Dataset-ID) für Assertions
  • Das Warehouse, das auf bigquery festgelegt werden muss
  • Benutzerdefinierte Variablen, die dem Projektcode während der Kompilierung zur Verfügung gestellt werden

Weitere Informationen zu den Einstellungen für das Dataform-Repository finden Sie unter IProjectConfig in der Dataform Core-Referenz

Nächste Schritte