Dieses Dokument hilft Ihnen, das Konzept der Repositories in Dataform zu verstehen.
Jedes Dataform-Repository enthält eine Sammlung von SQLX- und JavaScript-Dateien, aus denen Ihr SQL-Workflow besteht, sowie Dataform-Konfigurationsdateien und -pakete. Sie interagieren mit dem Inhalt Ihres Repositorys in einem Entwicklungsarbeitsbereich.
Dataform zeigt Ihre Repositories auf der Dataform-Seite in alphabetischer Reihenfolge der Repository-IDs an. Sie können sie sortieren und filtern.
Jedes Dataform-Repository ist mit einem Dienstkonto verbunden. Sie können ein Dienstkonto auswählen, wenn Sie ein Repository erstellen, oder das Dienstkonto später bearbeiten.
Standardmäßig verwendet Dataform ein Dienstkonto, das von Ihrer Projektnummer im folgenden Format abgeleitet wird:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform verwendet Git, um Änderungen aufzuzeichnen und Dateiversionen zu verwalten. Jedes Dataform-Repository entspricht einem Git-Repository. Nachdem Sie ein Dataform-Repository erstellt haben, können Sie es mit einem Remote-GitHub-, GitLab- oder Bitbucket-Repository verbinden.
Dataform speichert den Repository-Code in einem Dataform-Repository. In einem verbundenen Repository speichert das Drittanbieter-Repository den Repository-Code. Dataform interagiert mit dem Repository des Drittanbieters, damit Sie den Inhalt in einem Dataform-Entwicklungsarbeitsbereich bearbeiten und ausführen können.
Eine Dataform-Repository-Seite besteht aus den folgenden Komponenten:
- Tab „Entwicklungsarbeitsbereiche“
- Zeigt Entwicklungsarbeitsbereiche an, die im Repository erstellt wurden.
- Tab „Releasekonfigurationen“
- Ermöglicht das Überprüfen, Erstellen, Bearbeiten und Löschen von Releases.
- Tab mit Logs zur Workflowausführung
- Zeigt Ausführungsprotokolle für Dataform-Workflows an.
- Tab „Workflowkonfigurationen“
- Ermöglicht das Überprüfen, Erstellen, Bearbeiten und Löschen von Workflowkonfigurationen.
- Tab „Einstellungen“
- Zeigt den Namen und den Speicherort des Repositorys an. Bei einem Repository, das mit dem Git-Repository eines Drittanbieters verbunden ist, werden hier die Repository-Quelle des Drittanbieters, der Standardzweigname und das geheime Token angezeigt. Zeigt die Schaltflächen zum Verbinden des Repositorys mit dem Git-Repository eines Drittanbieters und zum Bearbeiten der Git-Verbindung an.
- Schaltfläche „Entwicklungsarbeitsbereich erstellen“
- Hier können Sie einen Entwicklungsarbeitsbereich erstellen.
Nachdem Sie einen Entwicklungsarbeitsbereich erstellt und initialisiert haben, können Sie die Datei mit den Workfloweinstellungen bearbeiten, um die folgenden Dataform-Einstellungen Ihres Repositorys zu konfigurieren:
- Die Standarddatenbank (Google Cloud-Projekt-ID)
- Das Standardschema (BigQuery-Dataset-ID)
- Der BigQuery-Standardstandort
- Das Standardschema (BigQuery-Dataset-ID) für Assertions
- Das Warehouse, das auf
bigquery
festgelegt werden muss - Benutzerdefinierte Variablen, die dem Projektcode während der Kompilierung zur Verfügung gestellt werden
Weitere Informationen zu den Einstellungen des Dataform-Repositorys finden Sie unter IProjectConfig in der Dataform Core-Referenz.
Nächste Schritte
- Informationen zum Erstellen und Initialisieren eines Arbeitsbereichs finden Sie unter Arbeitsbereich erstellen.
- Informationen zum Konfigurieren der Einstellungen für das Dataform-Repository finden Sie unter Dataform-Einstellungen konfigurieren.
- Informationen zum Verbinden eines Dataform-Repositorys mit einem Git-Repository eines Drittanbieters finden Sie unter Verbindung zu einem Drittanbieter-Git-Repository herstellen.
- Informationen zum Aufrufen von Workflow-Ausführungslogs finden Sie unter Ausführungslogs überwachen.
- Informationen zum Erstellen von Dataform-Kompilierungsreleases finden Sie unter Kompilierungsrelease erstellen.
- Weitere Informationen dazu, wie sich die Repository-Größe auf die Entwicklung in Dataform auswirkt, finden Sie unter Übersicht über die Repository-Größe.
- Informationen zum Planen von Dataform-Ausführungen mit Workflowkonfigurationen finden Sie unter Ausführungen mit Workflowkonfigurationen planen.
- Weitere Informationen zum Aufteilen eines Repositorys in Dataform finden Sie unter Einführung in das Aufteilen von Repositories.