Dieses Dokument hilft Ihnen, das Konzept Repositories in Dataform.
Jedes Dataform-Repository enthält eine Sammlung von SQLX und JavaScript -Dateien, aus denen Ihr SQL-Workflow besteht, sowie Konfigurationsdateien und -paketen. Sie interagieren mit den Inhalten Ihrer in einem Entwicklungsarbeitsbereich.
Dataform zeigt Ihre Repositories auf der Dataform-Seite in alphabetischer Reihenfolge der Repository-IDs. Sie können sie sortieren und filtern.
Jedes Dataform-Repository ist mit einem Dienstkonto verbunden. Sie können Beim Erstellen eines Repositorys ein Dienstkonto auswählen oder bearbeiten Sie das Dienstkonto .
Standardmäßig verwendet Dataform ein Dienstkonto, das aus Ihrem Projektnummer im folgenden Format:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform verwendet Git, um Änderungen aufzuzeichnen und Dateiversionen zu verwalten. Jedes Dataform-Repository entspricht einem Git-Repository. Nachdem Sie ein Dataform-Repository erstellt haben, können Sie es verbinden in ein Remote-Repository auf GitHub, GitLab oder Bitbucket übertragen.
Dataform speichert den Repository-Code in einem Dataform-Repository. In einem verbundenen Repository speichert das Drittanbieter-Repository den Repository-Code. Dataform interagiert mit dem Repository des Drittanbieters, damit Sie Folgendes bearbeiten können: und führen den Inhalt in einem Dataform-Entwicklungsarbeitsbereich aus.
Eine Dataform-Repository-Seite besteht aus den folgenden Komponenten:
- Tab „Entwicklungsarbeitsbereiche“
- Zeigt Entwicklungsarbeitsbereiche an, die im Repository erstellt wurden.
- Tab „Releasekonfigurationen“
- Untersuchen, erstellen, bearbeiten und löschen Releases.
- Tab mit Logs zur Workflowausführung
- Zeigt Ausführungsprotokolle für Dataform-Workflows an.
- Tab „Workflowkonfigurationen“
- Sehen, erstellen, bearbeiten und löschen Workflowkonfigurationen
- Tab „Einstellungen“
- Zeigt den Namen und den Speicherort des Repositorys an. Für ein verbundenes Repository Drittanbieter-Git-Repository, zeigt die Repository-Quelle des Drittanbieters an, Standardzweigname und geheimem Token. Zeigt die Schaltflächen an, Repository mit einem Drittanbieter verbinden Git-Repository und die Git-Verbindung bearbeiten.
- Schaltfläche „Entwicklungsarbeitsbereich erstellen“
- Hier können Sie einen Entwicklungsarbeitsbereich erstellen.
Nachdem Sie einen Entwicklungsarbeitsbereich erstellt und initialisiert haben, können Sie Datei mit Workfloweinstellungen bearbeiten, um die folgenden Dataform-Einstellungen Ihres Repositorys:
- Die Standarddatenbank (Google Cloud-Projekt-ID)
- Das Standardschema (BigQuery-Dataset-ID)
- Der BigQuery-Standardstandort
- Das Standardschema (BigQuery-Dataset-ID) für Assertions
- Das Warehouse, das auf
bigquery
festgelegt werden muss - Benutzerdefinierte Variablen, die dem Projektcode während der Kompilierung zur Verfügung gestellt werden
Weitere Informationen zu den Einstellungen für das Dataform-Repository finden Sie unter IProjectConfig in der Dataform Core-Referenz
Nächste Schritte
- Informationen zum Erstellen und Initialisieren eines Arbeitsbereichs finden Sie unter Arbeitsbereich erstellen
- Informationen zum Konfigurieren der Einstellungen für das Dataform-Repository finden Sie unter Dataform-Einstellungen konfigurieren
- Informationen zum Verbinden eines Dataform-Repositorys mit Git von Drittanbietern Weitere Informationen finden Sie unter Verbindung zu einem Git-Repository eines Drittanbieters herstellen.
- Informationen zum Aufrufen von Workflow-Ausführungsprotokollen finden Sie unter Ausführungsprotokolle überwachen
- Informationen zum Erstellen von Dataform-Kompilierungsreleases finden Sie unter Erstellen Sie einen Kompilierungsrelease.
- Weitere Informationen dazu, wie sich die Repository-Größe auf die Entwicklung in Dataform auswirkt, Siehe Übersicht über die Repository-Größe.
- Informationen zum Planen von Dataform-Ausführungen mit einem Workflow finden Sie unter Ausführungen mit Workflowkonfigurationen planen.
- Weitere Informationen zum Aufteilen eines Repositorys in Dataform finden Sie unter Einführung in das Aufteilen von Repositories