Dokumen ini membantu Anda memahami konsep repositori di Dataform.
Setiap repositori Dataform menyimpan kumpulan file SQLX dan JavaScript yang membentuk alur kerja SQL Anda, serta file dan paket konfigurasi Dataform. Anda berinteraksi dengan konten repositori Anda di ruang kerja pengembangan.
Dataform menampilkan repositori Anda di halaman Dataform dalam urutan abjad dari ID repositori. Anda dapat mengurutkan dan memfilternya.
Setiap repositori Dataform terhubung ke akun layanan. Anda dapat memilih akun layanan saat membuat repositori, atau mengedit akun layanan nanti.
Secara default, Dataform menggunakan akun layanan yang berasal dari nomor project Anda dalam format berikut:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform menggunakan Git untuk merekam perubahan dan mengelola versi file. Setiap repositori Dataform sesuai dengan repositori Git. Setelah membuat repositori Dataform, Anda dapat menghubungkannya ke repositori GitHub, GitLab, atau Bitbucket jarak jauh.
Dalam repositori Dataform, Dataform menyimpan kode repositori. Dalam repositori yang terhubung, repositori pihak ketiga menyimpan kode repositori. Dataform berinteraksi dengan repositori pihak ketiga agar Anda dapat mengedit dan menjalankan kontennya di ruang kerja pengembangan Dataform.
Halaman repositori Dataform terdiri dari komponen berikut:
- Tab Ruang kerja pengembangan
- Menampilkan ruang kerja pengembangan yang dibuat di repositori.
- Tab konfigurasi rilis
- Memungkinkan Anda memeriksa, membuat, mengedit, dan menghapus rilis.
- Tab log eksekusi alur kerja
- Menampilkan Log eksekusi alur kerja Dataform.
- Tab Konfigurasi alur kerja
- Memungkinkan Anda memeriksa, membuat, mengedit, dan menghapus konfigurasi alur kerja.
- Tab Setelan
- Menampilkan nama dan lokasi repositori. Untuk repositori yang terhubung ke repositori Git pihak ketiga, akan menampilkan sumber repositori pihak ketiga, nama cabang default, dan token rahasia. Menampilkan tombol untuk menghubungkan repositori ke repositori Git pihak ketiga dan untuk mengedit koneksi Git.
- Tombol buat ruang kerja pengembangan
- Memungkinkan Anda membuat ruang kerja pengembangan.
Setelah membuat dan menginisialisasi ruang kerja pengembangan, Anda dapat
mengedit file dataform.json
untuk mengonfigurasi
setelan Dataform repositori Anda berikut:
- Database default (ID project Google Cloud)
- Skema default (ID set data BigQuery)
- Lokasi BigQuery default
- Skema default (ID set data BigQuery) untuk pernyataan
- Gudang, yang harus ditetapkan ke
bigquery
- Variabel buatan pengguna yang tersedia untuk kode proyek selama kompilasi
Untuk informasi lebih lanjut tentang setelan repositori Dataform, lihat IProjectConfig di referensi inti Dataform.
Langkah selanjutnya
- Untuk mempelajari cara membuat dan menginisialisasi ruang kerja, lihat Membuat ruang kerja.
- Untuk mempelajari cara mengonfigurasi setelan repositori Dataform, lihat Mengonfigurasi setelan Dataform.
- Untuk mempelajari cara menghubungkan repositori Dataform ke repositori Git pihak ketiga, lihat Menghubungkan ke repositori Git pihak ketiga.
- Untuk mempelajari cara melihat log eksekusi alur kerja, lihat Memantau log eksekusi.
- Untuk mempelajari cara membuat rilis kompilasi Dataform, lihat Membuat rilis kompilasi.
- Untuk mempelajari lebih lanjut pengaruh ukuran repositori terhadap pengembangan di Dataform, lihat Ringkasan ukuran repositori.
- Untuk mempelajari cara menjadwalkan eksekusi Dataform dengan konfigurasi alur kerja, lihat Menjadwalkan eksekusi dengan konfigurasi alur kerja.
- Untuk mempelajari lebih lanjut cara membagi repositori dalam Dataform, lihat Pengantar cara memisahkan repositori.