Membuat dan menjalankan alur kerja SQL di Dataform
Panduan memulai ini memandu Anda melalui proses berikut di Dataform untuk membuat alur kerja SQL dan menjalankannya di BigQuery:
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API BigQuery and Dataform.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API BigQuery and Dataform.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk melakukan semua tugas dalam tutorial ini, minta administrator Anda untuk memberi Anda peran IAM berikut:
-
Admin Dataform (
roles/dataform.admin
) di repositori -
Dataform Editor (
roles/dataform.editor
) di ruang kerja dan pemanggilan alur kerja
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Membuat repositori Dataform
Di konsol Google Cloud, buka halaman Dataform.
Klik
Create repository.Di halaman Create repository, lakukan hal berikut:
Di kolom Repository ID, masukkan
quickstart-repository
.Dalam daftar Region, pilih
europe-west4
.Klik Create.
Membuat dan melakukan inisialisasi ruang kerja pengembangan Dataform
Di konsol Google Cloud, buka halaman Dataform.
Klik
quickstart-repository
.Klik
Create development workspace.Di jendela Create development workspace, lakukan langkah berikut:
Di kolom ID Ruang Kerja, masukkan
quickstart-workspace
.Klik Create.
Halaman ruang kerja pengembangan akan muncul.
Klik Inisialisasi ruang kerja.
Membuat tampilan
Di bagian berikut, Anda menentukan tampilan yang nantinya akan digunakan sebagai sumber data untuk tabel.
Membuat file SQLX untuk menentukan tampilan
Di panel Files, di samping
definitions/
, klik menu More.Klik Create file.
Di panel Create new file, lakukan langkah berikut:
Di kolom Add a file path, masukkan
definitions/quickstart-source.sqlx
.Klik Create file.
Menentukan tampilan
Di panel Files, luaskan folder definisi.
Klik
definitions/quickstart-source.sqlx
.Dalam file tersebut, masukkan cuplikan kode berikut:
config { type: "view" } SELECT "apples" AS fruit, 2 AS count UNION ALL SELECT "oranges" AS fruit, 5 AS count UNION ALL SELECT "pears" AS fruit, 1 AS count UNION ALL SELECT "bananas" AS fruit, 0 AS count
Klik Format.
Membuat tabel
Di bagian berikut, Anda akan menentukan jenis tabel dalam file SQLX, lalu
menulis pernyataan SELECT
untuk menentukan struktur tabel dalam file yang sama.
Membuat file SQLX untuk definisi tabel
Di panel Files, di samping
definitions/
, klik menu More, lalu pilih Create file.Di kolom Add a file path, masukkan
definitions/quickstart-table.sqlx
.Klik Create file.
Menentukan jenis tabel, struktur, dan dependensi
Di panel Files, luaskan direktori
definitions/
.Pilih
quickstart-table.sqlx
, lalu masukkan jenis tabel dan pernyataanSELECT
berikut:config { type: "table" } SELECT fruit, SUM(count) as count FROM ${ref("quickstart-source")} GROUP BY 1
Klik Format.
Setelah menentukan jenis tabel, Dataform akan menampilkan error validasi kueri karena quickstart-source
belum ada di BigQuery. Error ini
akan diatasi saat Anda menjalankan alur kerja SQL nanti dalam tutorial ini.
Memberikan akses Dataform ke BigQuery
Untuk menjalankan alur kerja di BigQuery, akun layanan Dataform harus memiliki peran yang diperlukan berikut ini:
- BigQuery Data Editor pada project tempat Dataform memerlukan akses baca dan tulis. File tersebut biasanya mencakup project yang menghosting repositori Dataform Anda.
- BigQuery Data Viewer pada project tempat Dataform memerlukan akses hanya baca.
- BigQuery Job User di project yang menghosting repositori Dataform Anda.
Untuk memberikan peran ini, ikuti langkah-langkah berikut:
Di konsol Google Cloud, buka halaman IAM.
Klik Tambahkan.
Di kolom New principals, masukkan ID akun layanan Dataform Anda.
Di menu drop-down Select a role, pilih peran BigQuery Job User.
Klik Add another role, lalu di menu drop-down Select a role, pilih peran BigQuery Data Editor.
Klik Add another role, lalu di menu drop-down Select a role, pilih peran BigQuery Data Viewer.
Klik Simpan.
Menjalankan alur kerja
Di konsol Google Cloud, buka halaman Dataform.
Di halaman
quickstart-workspace
, klik Start execution.Klik Semua tindakan.
Di panel Execute, klik Start execution.
Dataform menggunakan setelan repositori default untuk membuat konten alur kerja Anda dalam set data BigQuery yang disebut
dataform
.
Lihat log eksekusi di Dataform
Di halaman
quickstart-repository
, klik Workflow Execution Logs.Untuk melihat detail eksekusi Anda, klik eksekusi terbaru.
Pembersihan
Agar akun Google Cloud Anda tidak dikenakan biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Menghapus set data yang dibuat di BigQuery
Agar tidak menimbulkan biaya untuk aset BigQuery, hapus set data yang bernama dataform
.
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Penjelajah, luaskan project Anda lalu pilih
dataform
.Klik menu
Tindakan, lalu pilih Hapus.Pada dialog Delete dataset, masukkan
delete
ke dalam kolom, lalu klik Delete.
Menghapus ruang kerja pengembangan Dataform
Pembuatan ruang kerja pengembangan formulir data tidak dikenai biaya, tetapi untuk menghapus ruang kerja pengembangan, Anda dapat mengikuti langkah-langkah berikut:
Di konsol Google Cloud, buka halaman Dataform.
Klik
quickstart-repository
.Di tab Development workspace, klik menu
More olehquickstart-workspace
, lalu pilih Delete.Untuk mengonfirmasi, klik Delete.
Menghapus repositori Dataform
Pembuatan repositori formulir data tidak dikenai biaya, tetapi untuk menghapus repositori, Anda dapat mengikuti langkah-langkah berikut:
Di konsol Google Cloud, buka halaman Dataform.
Dengan
quickstart-repository
, klik menu Lainnya di , lalu pilih Hapus.Di jendela Delete repository, masukkan nama repositori untuk mengonfirmasi penghapusan.
Untuk mengonfirmasi, klik Delete.
Langkah selanjutnya
Untuk mempelajari Dataform lebih lanjut, lihat Ringkasan formulir data.
Untuk mempelajari fitur Dataform lebih lanjut, lihat Ringkasan fitur Dataform.
Untuk mempelajari Dataform core lebih lanjut, lihat Ringkasan inti Dataform.
Untuk mempelajari cara mengganti setelan Dataform default pada repositori Anda, lihat Mengonfigurasi setelan Dataform.
Untuk mempelajari lebih lanjut cara mengelola set data di BigQuery, lihat Mengelola set data.
Untuk mempelajari lebih lanjut cara mengelola tabel di BigQuery, lihat Mengelola tabel.