Mendeklarasikan sumber data

Dokumen ini menunjukkan cara mendeklarasikan sumber data BigQuery dengan Dataform core.

Anda dapat mendeklarasikan semua jenis tabel BigQuery sebagai sumber data dalam Dataform. Dengan mendeklarasikan sumber data BigQuery yang berada di luar Dataform, Anda dapat memperlakukan sumber data tersebut sebagai objek Dataform kelas satu. Setelah mendeklarasikan sumber data, Anda dapat mereferensikan atau me-resolve sumber data dengan cara yang sama seperti tabel lainnya dalam Dataform.

Sebelum memulai

Sebelum mendeklarasikan sumber data, buat dan inisialisasi ruang kerja pengembangan di repositori Anda.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan untuk mendeklarasikan sumber data, minta administrator untuk memberi Anda peran IAM Dataform Editor (roles/dataform.editor) di ruang kerja. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Membuat file SQLX untuk deklarasi sumber data

Simpan file SQLX untuk deklarasi sumber data di direktori definitions/. Untuk membuat file SQLX baru di direktori definitions/, ikuti langkah-langkah berikut:

  1. Di Konsol Cloud, buka halaman Dataform.

    Buka halaman Dataform

  2. Pilih repositori.

  3. Pilih ruang kerja pengembangan.

  4. Di panel Files, di samping definitions/, klik menu More.

  5. Klik Create file.

  6. Di panel Create new file, lakukan langkah berikut:

    1. Di kolom Add a file path, setelah definitions/, masukkan nama file, diikuti dengan .sqlx. Contoh, definitions/dataset-declaration.sqlx.

      Nama file hanya boleh berisi angka, huruf, tanda hubung, dan garis bawah.

    2. Klik Create file.

Mendeklarasikan sumber data

Anda dapat mendeklarasikan satu sumber data per file deklarasi SQLX. Untuk mendeklarasikan sumber data dalam blok konfigurasi file SQLX, ikuti langkah-langkah berikut:

  1. Di ruang kerja pengembangan Anda, di panel Files, klik file SQLX untuk deklarasi sumber data.
  2. Dalam file tersebut, masukkan cuplikan kode berikut:

    config {
      type: "declaration",
      database: "DATABASE",
      schema: "SCHEMA",
      name: "NAME",
    }
    

    Ganti kode berikut:

    • DATABASE: project ID untuk project yang berisi sumber data.
    • SCHEMA: set data BigQuery tempat sumber data berada.
    • NAME: nama tabel atau tampilan yang ingin Anda gunakan sebagai sumber data. Anda nanti dapat menggunakan nama tersebut untuk mereferensikan sumber data di Dataform.
  3. Opsional: Klik Format.

Contoh kode berikut menunjukkan contoh deklarasi tabel shakespeare dalam set data samples dari project bigquery-public-data sebagai sumber data:

    config {
      type: "declaration",
      database: "bigquery-public-data",
      schema: "samples",
      name: "shakespeare",
    }

Langkah selanjutnya