Dokumen ini membantu Anda memahami konsep repositori di Dataform.
Setiap repositori Dataform menyimpan kumpulan file SQLX dan JavaScript yang membentuk alur kerja SQL Anda, serta file dan paket konfigurasi Dataform. Anda berinteraksi dengan konten repositori di ruang kerja pengembangan.
Dataform menampilkan repositori Anda di halaman Dataform dalam urutan alfabetik ID repositori. Anda dapat mengurutkan dan memfilternya.
Setiap repositori Dataform terhubung ke akun layanan. Anda dapat memilih akun layanan saat membuat repositori, atau mengedit akun layanan nanti.
Secara default, Dataform menggunakan akun layanan yang berasal dari nomor project Anda dalam format berikut:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform menggunakan Git untuk mencatat perubahan dan mengelola versi file. Setiap repositori Dataform sesuai dengan repositori Git. Setelah membuat repositori Dataform, Anda dapat menghubungkannya ke repositori GitHub, GitLab, atau Bitbucket jarak jauh.
Di repositori Dataform, Dataform menyimpan kode repositori. Dalam repositori yang terhubung, repositori pihak ketiga menyimpan kode repositori. Dataform berinteraksi dengan repositori pihak ketiga untuk memungkinkan Anda mengedit dan menjalankan kontennya di ruang kerja pengembangan Dataform.
Halaman repositori Dataform terdiri dari komponen berikut:
- Tab ruang kerja pengembangan
- Menampilkan ruang kerja pengembangan yang dibuat di repositori.
- Tab konfigurasi rilis
- Memungkinkan Anda memeriksa, membuat, mengedit, dan menghapus rilis.
- Tab log eksekusi alur kerja
- Menampilkan log eksekusi alur kerja Dataform.
- Tab konfigurasi alur kerja
- Memungkinkan Anda memeriksa, membuat, mengedit, dan menghapus konfigurasi alur kerja.
- Tab Setelan
- Menampilkan nama dan lokasi repositori. Untuk repositori yang terhubung ke repositori Git pihak ketiga, menampilkan sumber repositori pihak ketiga, nama cabang default, dan token rahasia. Menampilkan tombol untuk menghubungkan repositori ke repositori Git pihak ketiga dan untuk mengedit koneksi Git.
- Tombol Create development workspace
- Memungkinkan Anda membuat ruang kerja pengembangan.
Setelah membuat dan melakukan inisialisasi ruang kerja pengembangan, Anda dapat mengedit file setelan alur kerja untuk mengonfigurasi setelan Dataform berikut dari repositori Anda:
- Database default (ID project Google Cloud)
- Skema default (ID set data BigQuery)
- Lokasi BigQuery default
- Skema default (ID set data BigQuery) untuk pernyataan
- Gudang, yang harus ditetapkan ke
bigquery
- Variabel buatan pengguna yang disediakan untuk kode project selama kompilasi
Untuk mengetahui informasi selengkapnya tentang setelan repositori Dataform, lihat IProjectConfig dalam referensi inti Dataform.
Langkah selanjutnya
- Untuk mempelajari cara membuat dan melakukan inisialisasi ruang kerja, lihat Membuat ruang kerja.
- Untuk mempelajari cara mengonfigurasi setelan repositori Dataform, lihat Mengonfigurasi setelan Dataform.
- Untuk mempelajari cara menghubungkan repositori Dataform ke repositori Git pihak ketiga, lihat Menghubungkan ke repositori Git pihak ketiga.
- Untuk mempelajari cara melihat log eksekusi alur kerja, lihat Memantau log eksekusi.
- Untuk mempelajari cara membuat rilis kompilasi Dataform, lihat Membuat rilis kompilasi.
- Untuk mempelajari lebih lanjut dampak ukuran repositori terhadap pengembangan di Dataform, lihat Ringkasan ukuran repositori.
- Untuk mempelajari cara menjadwalkan eksekusi Dataform dengan konfigurasi alur kerja, lihat Menjadwalkan eksekusi dengan konfigurasi alur kerja.
- Untuk mempelajari lebih lanjut cara memisahkan repositori di Dataform, lihat Pengantar pemisahan repositori.