Menyiapkan data dengan Gemini

Dokumen ini menjelaskan cara membuat dan mengelola saran kode SQL untuk persiapan data Anda di BigQuery.

Untuk mengetahui informasi selengkapnya, lihat Pengantar persiapan data BigQuery.

Sebelum memulai

Membuka editor persiapan data di BigQuery

Anda dapat membuka editor persiapan data di BigQuery dengan membuat persiapan data baru, membuat persiapan data dari tabel yang ada, atau membuka persiapan data yang ada. Untuk mengetahui informasi selengkapnya tentang hal yang terjadi saat Anda membuat persiapan data, lihat Titik entri persiapan data.

Di halaman BigQuery Studio, Anda dapat membuka editor persiapan data dengan cara berikut:

Buat baru

Untuk membuat persiapan data baru di BigQuery, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery Studio.
    Buka BigQuery
  2. Buka daftar Buat baru, lalu klik Penyediaan data. Editor persiapan data ditampilkan di tab persiapan data baru tanpa judul.
  3. Di kotak penelusuran editor, masukkan nama tabel atau kata kunci, lalu pilih tabel. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan kumpulan awal saran penyiapan data dari Gemini.

    Resource Persiapan data akan muncul di panel Penjelajah, tempat Anda dapat mengakses persiapan ini di masa mendatang.
  4. Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.

Membuat baru dari tabel

Untuk membuat persiapan data baru dari tabel yang ada, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery Studio.
    Buka BigQuery
  2. Di panel Explorer, tahan kursor ke tabel.
  3. Klik more_vert Menu > Kueri di > Persiapan data. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan serangkaian awal saran penyiapan data dari Gemini.

    Resource Persiapan data akan muncul di panel Penjelajah, tempat Anda dapat mengakses persiapan ini di masa mendatang.
  4. Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.

Buka yang ada

Untuk membuka editor persiapan data yang ada, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery Studio.
    Buka BigQuery
  2. Di panel Explorer, klik nama project Anda dan persiapan data.
  3. Pilih persiapan data yang ada. Tampilan grafik pipeline persiapan data akan ditampilkan.
  4. Pilih salah satu node dalam grafik. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan kumpulan awal saran penyiapan data dari Gemini.
  5. Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.

Membuat langkah-langkah persiapan data

Anda menyiapkan data secara bertahap. Anda dapat melihat pratinjau atau menerapkan langkah-langkah yang disarankan oleh Gemini. Anda juga dapat menyesuaikan saran, atau menerapkan langkah-langkah Anda sendiri. Untuk mengetahui informasi selengkapnya tentang langkah-langkah persiapan data yang didukung, lihat Langkah-langkah yang didukung.

Melihat, mengedit, dan menerapkan saran dari Gemini

Saat Anda membuka editor persiapan data untuk tabel pada langkah sebelumnya, Gemini akan memeriksa data dan skema dari tabel yang Anda muat dan menghasilkan saran.

Saat Anda melihat data dalam tampilan data, klik nama kolom atau sel tertentu. Gemini menghasilkan saran filter dan transformasi yang khusus untuk kolom atau sel tersebut.

Terapkan saran dari Gemini sebagai langkah persiapan data:

  1. Di tampilan data, buka daftar Langkah dan tinjau sarannya.
  2. Opsional: Untuk melihat pratinjau hasil kartu saran, klik Pratinjau.
  3. Opsional: Untuk mengubah kartu saran menggunakan bahasa alami, klik Edit.

    Untuk mengetahui informasi selengkapnya tentang cara mengubah saran, lihat Meningkatkan saran dengan contoh dan Menambahkan langkah dengan bahasa alami atau ekspresi SQL.

  4. Klik Terapkan.

Anda dapat melakukan tindakan berikut di tampilan data saat mengklik Langkah-langkah yang diterapkan dan memeriksa daftar langkah-langkah:

  • Edit atau hapus langkah dalam daftar dengan mengklik more_vert Menu, lalu lakukan perubahan.
  • Pilih langkah apa pun dalam daftar untuk melihat skema dan sampel data mulai dari langkah tertentu ini.
  • Pilih langkah dalam daftar untuk menyisipkan langkah baru setelah langkah yang dipilih.

Meningkatkan saran dengan contoh

Untuk menyesuaikan saran dari Gemini, berikan contoh tampilan data dalam sel:

  1. Di tampilan data, edit nilai satu hingga tiga sel untuk menunjukkan tampilan nilai di kolom tersebut. Misalnya, masukkan tanggal seperti yang Anda inginkan untuk memformat semua tanggal. Gemini menghasilkan saran baru berdasarkan perubahan Anda.

  2. Untuk mengubah kartu saran, klik Edit.

  3. Klik Terapkan.

Menambahkan langkah dengan bahasa alami atau ekspresi SQL

Jika tidak ada saran yang memenuhi kebutuhan Anda, tambahkan saran Anda sendiri dengan mengklik Tambahkan langkah, memilih jenis langkah, dan memasukkan perintah dalam bahasa alami yang menjelaskan intent Anda.

Menambahkan transformasi

  1. Di tampilan data, klik Tambahkan langkah, lalu pilih opsi Transformasi.
  2. Di kolom Deskripsi, masukkan perintah, seperti Convert the state column to a uppercase.
  3. Klik kirim Kirim.

    Gemini menghasilkan ekspresi SQL dan deskripsi baru berdasarkan perintah Anda.

  4. Dalam daftar Target column, pilih atau masukkan nama kolom.

  5. Opsional: Untuk memperbarui ekspresi SQL, revisi perintah dan klik kirim Kirim, atau masukkan ekspresi SQL secara manual.

  6. Opsional: Klik Pratinjau dan tinjau langkahnya.

  7. Klik Terapkan.

Memfilter baris

Untuk menambahkan filter yang menghapus baris, ikuti langkah-langkah berikut:

  1. Di tampilan data, klik Tambahkan langkah > Filter.
  2. Di kolom Deskripsi, masukkan perintah, seperti Column ID should not be NULL.
  3. Klik Generate. Gemini menghasilkan ekspresi SQL dan deskripsi baru berdasarkan perintah Anda.
  4. Opsional: Untuk memperbarui ekspresi SQL, revisi perintah dan klik kirim Kirim, atau masukkan ekspresi SQL secara manual.
  5. Opsional: Klik Pratinjau dan tinjau langkahnya.
  6. Klik Terapkan.

Format ekspresi filter

Ekspresi SQL untuk filter mempertahankan baris yang cocok dengan kondisi yang ditentukan. Hal ini setara dengan pernyataan SELECT … WHERE SQL_EXPRESSION.

Misalnya, untuk mempertahankan data dengan kolom, year lebih besar dari atau sama dengan 2000, kondisinya adalah year >= 2000.

Ekspresi harus mengikuti sintaksis SQL BigQuery untuk klausa WHERE.

Mengonfigurasi tabel error dan menambahkan aturan validasi

Anda dapat menambahkan filter yang membuat aturan validasi, yang mengirim error ke tabel error atau membuat penyiapan data gagal dijalankan.

Mengonfigurasi tabel error

Untuk mengonfigurasi tabel error, ikuti langkah-langkah berikut:

  1. Di tampilan data, buka toolbar dan klik Lainnya > Tabel error.
  2. Klik Aktifkan tabel error.
  3. Tentukan lokasi tabel.
  4. Opsional: Tentukan durasi maksimum untuk menyimpan error.
  5. Klik Simpan.

Menambahkan aturan validasi

Untuk menambahkan aturan validasi, ikuti langkah-langkah berikut:

  1. Di tampilan data, klik Tambahkan langkah > Filter.
  2. Masukkan deskripsi untuk langkah tersebut.
  3. Masukkan ekspresi SQL, dalam bentuk klausa WHERE.
  4. Opsional: Jika Anda ingin ekspresi SQL berfungsi sebagai aturan validasi, centang kotak Failed validation rows go to error table. Anda juga dapat mengubah filter menjadi validasi di toolbar persiapan data dengan mengklik Lainnya > Tabel error.
  5. Opsional: Klik Pratinjau dan tinjau langkahnya.
  6. Klik Terapkan.

Menghapus kolom

Untuk menghapus kolom dari persiapan data, ikuti langkah-langkah berikut:

  1. Di tampilan skema, klik more_vert Menu di samping kolom yang akan dihapus.
  2. Klik Hapus. Langkah baru yang diterapkan ditambahkan untuk kolom yang dihapus.

Menambahkan operasi join dengan Gemini

Untuk menambahkan langkah operasi join antara dua sumber dalam persiapan data, ikuti langkah-langkah berikut:

  1. Di tampilan data untuk node dalam persiapan data, buka daftar Langkah, lalu klik Tambahkan langkah > Join.
  2. Dalam dialog Tambahkan join, klik Jelajahi, lalu pilih tabel lain yang terlibat dalam operasi join (disebut sebagai sisi kanan join).
  3. Opsional: Pilih jenis operasi join yang ingin Anda lakukan, seperti Inner join.
  4. Tinjau informasi kunci join yang dibuat Gemini di kolom berikut:

    • Deskripsi join: Deskripsi bahasa alami dari ekspresi SQL untuk operasi join. Saat Anda mengedit deskripsi ini dan mengklik kirim Kirim, Gemini akan menyarankan kondisi join SQL baru.
    • Kondisi join: Ekspresi SQL dalam klausa ON untuk operasi join. Anda dapat menggunakan penentu L dan R untuk merujuk ke tabel sumber kiri dan kanan. Misalnya, untuk menggabungkan kolom customer_id dari tabel kiri ke kolom customer_id dari tabel kanan, masukkan L.customerId = R.customerId. Penentu ini tidak peka huruf besar/kecil.

  5. Opsional: Untuk menyaring saran dari Gemini, edit kolom Deskripsi join, lalu klik kirim Kirim.

  6. Opsional: Untuk melihat pratinjau setelan operasi join dari persiapan data Anda, klik Pratinjau.

  7. Klik Terapkan.

    Langkah operasi join dibuat. Tabel sumber yang Anda pilih (sisi kanan join) dan operasi join ditampilkan dalam daftar langkah yang diterapkan dan di node dalam tampilan grafik persiapan data Anda.

Menambahkan atau mengubah tabel tujuan

Untuk menambahkan atau mengubah tabel tujuan untuk output persiapan data Anda, ikuti langkah-langkah berikut:

  1. Di tampilan data, klik Tambahkan > Tujuan.
  2. Pilih project tempat tabel tujuan disimpan.
  3. Pilih salah satu set data, atau muat set data baru.
  4. Masukkan tabel tujuan. Jika tabel tidak ada, persiapan data akan membuat tabel baru saat pertama kali dijalankan. Untuk mengetahui informasi selengkapnya, lihat Mode tulis.
  5. Pilih set data Anda sebagai set data tujuan.
  6. Klik Simpan.

Menjalankan persiapan data

Setelah menambahkan langkah-langkah persiapan data, mengonfigurasi tujuan, dan memperbaiki error validasi, Anda dapat menjalankan pengujian pada sampel data, atau men-deploy langkah-langkah dan menjadwalkan persiapan data. Untuk informasi selengkapnya, lihat Menjadwalkan persiapan data.

Memuat ulang contoh persiapan data

Data dalam sampel tidak otomatis diperbarui. Jika data dalam tabel sumber untuk persiapan data telah berubah, tetapi perubahan tersebut tidak tercermin dalam sampel data persiapan, klik Lainnya > Muat ulang sampel.

Langkah berikutnya