Membuat dan menjalankan alur kerja di Dataform

Panduan memulai ini akan memandu Anda melalui proses berikut di Dataform untuk membuat alur kerja dan menjalankannya di BigQuery:

Sebelum memulai

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  8. Peran yang diperlukan

    Untuk mendapatkan izin yang diperlukan untuk membuat dan menjalankan alur kerja di Dataform, minta administrator Anda untuk memberi Anda peran IAM berikut pada project yang akan menghosting repositori Dataform Anda:

    Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

    Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran kustom atau peran yang telah ditentukan lainnya.

    Membuat repositori Dataform

    1. Di konsol Google Cloud , buka halaman Dataform.

      Buka Dataform

    2. Klik Buat repositori.

    3. Di halaman Create repository, lakukan hal berikut:

      1. Di kolom Repository ID, masukkan quickstart-repository.

      2. Dalam daftar Region, pilih europe-west4.

      3. Klik Buat.

    Membuat dan melakukan inisialisasi ruang kerja pengembangan Dataform

    1. Di konsol Google Cloud , buka halaman Dataform.

      Buka Dataform

    2. Klik quickstart-repository.

    3. Klik Buat ruang kerja pengembangan.

    4. Di jendela Create development workspace, lakukan hal berikut:

      1. Di kolom Workspace ID, masukkan quickstart-workspace.

      2. Klik Buat.

      Halaman ruang kerja pengembangan akan muncul.

    5. Klik Initialize workspace.

    Membuat tampilan

    Di bagian berikut, Anda akan menentukan tampilan yang nantinya akan digunakan sebagai sumber data untuk tabel.

    Membuat file SQLX untuk menentukan tabel virtual

    1. Di panel Files, di samping definitions/, klik menu More.

    2. Klik Create file.

    3. Di panel Create new file, lakukan hal berikut:

      1. Di kolom Add a file path, masukkan definitions/quickstart-source.sqlx.

      2. Klik Create file.

    Menentukan tabel virtual

    1. Di panel Files, luaskan folder definitions.

    2. Klik definitions/quickstart-source.sqlx.

    3. Di file tersebut, masukkan cuplikan kode berikut:

      config {
       type: "view"
      }
      
      SELECT
       "apples" AS fruit,
       2 AS count
      UNION ALL
      SELECT
       "oranges" AS fruit,
       5 AS count
      UNION ALL
      SELECT
       "pears" AS fruit,
       1 AS count
      UNION ALL
      SELECT
       "bananas" AS fruit,
       0 AS count
      
    4. Klik Format.

    Membuat tabel

    Pada bagian berikut, tentukan jenis tabel dalam file SQLX, lalu tulis pernyataan SELECT untuk menentukan struktur tabel dalam file yang sama.

    Membuat file SQLX untuk definisi tabel

    1. Di panel Files, di samping definitions/, klik menu More, lalu pilih Create file.

    2. Di kolom Add a file path, masukkan definitions/quickstart-table.sqlx.

    3. Klik Create file.

    Tentukan jenis tabel, struktur, dan dependensinya

    1. Di panel Files, luaskan direktori definitions/.

    2. Pilih quickstart-table.sqlx, lalu masukkan jenis tabel dan pernyataan SELECT berikut:

      config {
       type: "table"
      }
      
      SELECT
       fruit,
       SUM(count) as count
      FROM ${ref("quickstart-source")}
      GROUP BY 1
      
    3. Klik Format.

    Setelah menentukan jenis tabel, Dataform akan menampilkan error validasi kueri karena quickstart-source belum ada di BigQuery. Error ini akan diselesaikan saat Anda menjalankan alur kerja nanti dalam tutorial ini.

    Jalankan alur kerja di BigQuery

    1. Di konsol Google Cloud , buka halaman Dataform.

      Buka Dataform

    2. Di halaman quickstart-workspace, klik Start execution.

    3. Klik Semua tindakan.

    4. Klik Start execution.

    5. Dalam dialog yang terbuka, klik Izinkan untuk memberikan izin ke BigQuery Pipelines agar dapat mengakses Akun Google Anda.

      Dataform menggunakan setelan repositori default untuk membuat konten alur kerja Anda dalam set data BigQuery yang disebut dataform.

    Melihat log eksekusi di Dataform

    1. Di halaman quickstart-repository, klik Workflow Execution Logs.

    2. Untuk melihat detail eksekusi Anda, klik eksekusi terbaru.

    Pembersihan

    Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.

    Hapus set data yang dibuat di BigQuery

    Untuk menghindari biaya aset BigQuery, hapus set data yang disebut dataform.

    1. Di konsol Google Cloud , buka halaman BigQuery.

      Buka BigQuery

    2. Di panel Explorer, luaskan project Anda dan pilih dataform.

    3. Klik menu Tindakan , lalu pilih Hapus.

    4. Pada dialog Delete dataset, masukkan delete ke dalam kolom, lalu klik Delete.

    Menghapus ruang kerja pengembangan Dataform

    Pembuatan ruang kerja pengembangan Dataform tidak dikenai biaya, tetapi untuk menghapus ruang kerja pengembangan, Anda dapat mengikuti langkah-langkah berikut:

    1. Di konsol Google Cloud , buka halaman Dataform.

      Buka Dataform

    2. Klik quickstart-repository.

    3. Di tab Ruang kerja pengembangan, klik menu Lainnya dengan quickstart-workspace, lalu pilih Hapus.

    4. Untuk mengonfirmasi, klik Hapus.

    Menghapus repositori Dataform

    Pembuatan repositori Dataform tidak menimbulkan biaya, tetapi untuk menghapus repositori, Anda dapat mengikuti langkah-langkah berikut:

    1. Di konsol Google Cloud , buka halaman Dataform.

      Buka Dataform

    2. Di quickstart-repository, klik menu Lainnya, lalu pilih Hapus.

    3. Di jendela Hapus repositori, masukkan nama repositori untuk mengonfirmasi penghapusan.

    4. Untuk mengonfirmasi, klik Hapus.

    Langkah berikutnya