Menyiapkan data dengan Gemini

Dokumen ini menjelaskan cara membuat dan mengelola saran kode SQL untuk persiapan data Anda di BigQuery.

Untuk mengetahui informasi selengkapnya, lihat Pengantar persiapan data BigQuery.

Sebelum memulai

Membuka editor persiapan data di BigQuery

Anda dapat membuka editor persiapan data di BigQuery dengan membuat persiapan data baru, membuat persiapan data dari tabel yang ada, atau membuka persiapan data yang ada. Untuk mengetahui informasi selengkapnya tentang hal yang terjadi saat Anda membuat persiapan data, lihat Titik entri persiapan data.

Di halaman BigQuery Studio, Anda dapat membuka editor persiapan data dengan cara berikut:

Buat baru

Untuk membuat persiapan data baru di BigQuery, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery Studio.
    Buka BigQuery
  2. Buka daftar Buat baru, lalu klik Penyediaan data. Editor persiapan data ditampilkan di tab persiapan data baru tanpa judul.
  3. Di kotak penelusuran editor, masukkan nama tabel atau kata kunci, lalu pilih tabel. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan kumpulan awal saran penyiapan data dari Gemini.

    Resource Persiapan data akan muncul di panel Penjelajah, tempat Anda dapat mengakses persiapan ini di masa mendatang.
  4. Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.

Membuat baru dari tabel

Untuk membuat persiapan data baru dari tabel yang ada, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery Studio.
    Buka BigQuery
  2. Di panel Explorer, tahan kursor ke tabel.
  3. Klik more_vert Menu > Kueri di > Persiapan data. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan serangkaian saran penyiapan data awal dari Gemini.

    Resource Persiapan data akan muncul di panel Penjelajah, tempat Anda dapat mengakses persiapan ini di masa mendatang.
  4. Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.

Buka yang ada

Untuk membuka editor persiapan data yang ada, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery Studio.
    Buka BigQuery
  2. Di panel Explorer, klik nama project Anda dan persiapan data.
  3. Pilih persiapan data yang ada. Tampilan grafik pipeline persiapan data akan ditampilkan.
  4. Pilih salah satu node dalam grafik. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan kumpulan awal saran penyiapan data dari Gemini.
  5. Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.

Membuat langkah-langkah persiapan data

Anda menyiapkan data secara bertahap. Anda dapat melihat pratinjau atau menerapkan langkah-langkah yang disarankan oleh Gemini. Anda juga dapat menyesuaikan saran, atau menerapkan langkah-langkah Anda sendiri. Untuk mengetahui informasi selengkapnya tentang langkah-langkah persiapan data yang didukung, lihat Langkah-langkah yang didukung.

Melihat dan menerapkan saran oleh Gemini

Saat Anda membuka editor persiapan data untuk tabel pada langkah sebelumnya, Gemini akan memeriksa data dan skema dari tabel yang Anda muat dan menghasilkan saran.

Saat Anda melihat data dalam tampilan data, klik nama kolom atau sel tertentu. Gemini menghasilkan saran filter dan transformasi yang khusus untuk kolom atau sel tersebut.

Terapkan saran dari Gemini sebagai langkah penyiapan data:

  1. Di tampilan data, buka daftar Langkah dan tinjau saran.
  2. Opsional: Untuk mengedit deskripsi atau ekspresi SQL di kartu saran, klik Pratinjau.
  3. Klik Terapkan.
  4. Opsional: Untuk mendapatkan saran yang lebih baik dari Gemini, berikan contoh dan ulangi langkah-langkah ini.

Anda dapat melakukan tindakan berikut di tampilan data saat mengklik Langkah-langkah yang diterapkan dan memeriksa daftar langkah-langkah:

  • Untuk mengedit atau menghapus langkah, klik more_vert Menu, lalu lakukan perubahan.
  • Pilih langkah apa pun dalam daftar untuk melihat sampel dan skema data mulai dari langkah tertentu ini.
  • Pilih langkah dalam daftar untuk menyisipkan langkah baru setelah langkah yang dipilih.

Meningkatkan saran dengan contoh

Untuk menyesuaikan saran dari Gemini, berikan contoh tampilan data dalam sel:

  1. Di tampilan data, edit nilai satu hingga tiga sel untuk menunjukkan tampilan nilai di kolom tersebut. Misalnya, masukkan tanggal seperti yang Anda inginkan untuk memformat semua tanggal. Gemini menghasilkan saran baru berdasarkan perubahan Anda.

  2. Untuk mengubah kartu saran, klik Pratinjau.

  3. Klik Terapkan.

Menambahkan langkah secara manual

Jika tidak ada saran yang sesuai dengan kebutuhan Anda, tambahkan saran Anda sendiri dengan mengklik Tambahkan langkah, memilih jenis langkah, dan memasukkan deskripsi serta ekspresi SQL.

Menambahkan transformasi

  1. Di tampilan data, pilih kolom, lalu klik Tambahkan langkah > Transformasi.
  2. Masukkan deskripsi untuk langkah tersebut.
  3. Masukkan ekspresi SQL.
  4. Di kolom Target column, pilih kolom atau buat kolom baru.
  5. Opsional: Klik Pratinjau dan tinjau langkahnya.
  6. Klik Terapkan.

Memfilter baris

Untuk menambahkan filter yang menghapus baris, ikuti langkah-langkah berikut:

  1. Di tampilan data, klik Tambahkan langkah > Filter.
  2. Masukkan deskripsi untuk langkah tersebut.
  3. Masukkan ekspresi SQL.
  4. Opsional: Klik Pratinjau dan tinjau langkahnya.
  5. Klik Terapkan.

Format ekspresi filter

Ekspresi SQL untuk filter mempertahankan baris yang cocok dengan kondisi yang ditentukan. Hal ini setara dengan pernyataan SELECT … WHERE SQL_EXPRESSION.

Misalnya, untuk mempertahankan data dengan kolom, year lebih besar dari atau sama dengan 2000, kondisinya adalah year >= 2000.

Ekspresi harus mengikuti sintaksis SQL BigQuery untuk klausa WHERE.

Mengonfigurasi tabel error dan menambahkan aturan validasi

Anda dapat menambahkan filter yang membuat aturan validasi, yang mengirim error ke tabel error atau membuat penyiapan data gagal dijalankan.

Mengonfigurasi tabel error

Untuk mengonfigurasi tabel error, ikuti langkah-langkah berikut:

  1. Di tampilan data, buka toolbar dan klik Lainnya > Tabel error.
  2. Klik Aktifkan tabel error.
  3. Tentukan lokasi tabel.
  4. Opsional: Tentukan durasi maksimum untuk menyimpan error.
  5. Klik Simpan.

Menambahkan aturan validasi

Untuk menambahkan aturan validasi, ikuti langkah-langkah berikut:

  1. Di tampilan data, klik Tambahkan langkah > Filter.
  2. Masukkan deskripsi untuk langkah tersebut.
  3. Masukkan ekspresi SQL, dalam bentuk klausa WHERE.
  4. Opsional: Jika Anda ingin ekspresi SQL berfungsi sebagai aturan validasi, centang kotak Failed validation rows go to error table. Anda juga dapat mengubah filter menjadi validasi di toolbar persiapan data dengan mengklik Lainnya > Tabel error.
  5. Opsional: Klik Pratinjau dan tinjau langkahnya.
  6. Klik Terapkan.

Menghapus kolom

Untuk menghapus kolom dari persiapan data, ikuti langkah-langkah berikut:

  1. Di tampilan skema, klik more_vert Menu di samping kolom yang akan dihapus.
  2. Klik Hapus. Langkah baru yang diterapkan ditambahkan untuk kolom yang dihapus.

Menambahkan operasi join

Untuk menambahkan langkah operasi join antara dua sumber dalam persiapan data, ikuti langkah-langkah berikut:

  1. Di tampilan data untuk node dalam persiapan data, buka daftar Langkah, lalu klik Tambahkan langkah > Gabung.
  2. Dalam dialog Configure join, pilih tabel lain yang terlibat dalam operasi join (disebut sebagai sisi kanan join).
  3. Opsional: Pilih kunci join untuk setiap tabel. Kunci join harus memiliki jenis data yang sama.
  4. Opsional: Pilih jenis operasi join yang akan dilakukan, seperti Inner join.
  5. Opsional: Untuk menyiapkan tabel sisi kanan sebelum menentukan kunci join, seperti saat jenis data dari dua kolom dalam join berbeda, ikuti langkah-langkah berikut:

    1. Menyimpan join tanpa memilih kunci gabungan.
    2. Buka tampilan grafik dan pilih tabel sumber di sisi kanan.
    3. Siapkan tabel sisi kanan, seperti mengubah jenis data kolom.
    4. Edit join yang Anda simpan di langkah sebelumnya dengan menetapkan kunci.
  6. Klik Create.

Semua baris tabel dipertahankan, meskipun tidak ada nilai yang sesuai di salah satu tabel.

Setelah Anda menyimpan langkah, tabel sumber yang Anda pilih (sisi kanan join) dan operasi join akan ditampilkan dalam daftar langkah yang diterapkan dan dalam node di tampilan grafik persiapan data Anda.

Menambahkan atau mengubah tabel tujuan

Untuk menambahkan atau mengubah tabel tujuan untuk output persiapan data Anda, ikuti langkah-langkah berikut:

  1. Di tampilan data, klik Tambahkan > Tujuan.
  2. Pilih project tempat tabel tujuan disimpan.
  3. Pilih salah satu set data, atau muat set data baru.
  4. Masukkan tabel tujuan. Jika tabel tidak ada, persiapan data akan membuat tabel baru saat pertama kali dijalankan. Untuk mengetahui informasi selengkapnya, lihat Mode tulis.
  5. Pilih set data Anda sebagai set data tujuan.
  6. Klik Simpan.

Menjalankan persiapan data

Untuk menjalankan langkah-langkah persiapan data dan memuat data yang disiapkan ke dalam tabel tujuan, jadwalkan operasi persiapan data satu kali atau berulang:

  1. Simpan perubahan yang tertunda dalam persiapan data.
  2. Di toolbar persiapan data, klik Jadwalkan.
  3. Masukkan nama jadwal.
  4. Masukkan nama akun layanan yang terkait dengan eksekusi.
  5. Tetapkan frekuensi.
  6. Klik Buat jadwal.

Untuk informasi selengkapnya, lihat Menjadwalkan persiapan data.

Memuat ulang contoh persiapan data

Data dalam sampel tidak otomatis diperbarui. Jika data dalam tabel sumber untuk persiapan data telah berubah, tetapi perubahan tersebut tidak tercermin dalam sampel data persiapan, klik Lainnya > Muat ulang sampel.

Langkah selanjutnya