Memfilter data

Halaman ini menjelaskan cara menyaring data ketika Anda menyiapkan data di Wrangler ruang kerja Cloud Data Fusion Studio. Di Wrangler, Anda dapat memfilter baris data di kolom jenis data apa pun, kecuali jenis boolean. Anda menyimpan atau menghapus baris berdasarkan kondisi yang Anda konfigurasi.

Untuk menyimpan atau menghapus baris berdasarkan kondisi, ikuti langkah-langkah berikut:

  1. Buka ruang kerja Wrangler di Cloud Data Fusion.
  2. Pada tab Data, buka nama kolom, lalu klik arrow_drop_down panah peluas.
  3. Pilih Filter, lalu pilih opsi—misalnya, Simpan baris dan Jika nilai berisi.
  4. Tentukan kondisi.
  5. Klik Terapkan.

Nilainya berubah berdasarkan filter. Wrangler menambahkan filter-rows-on direktif ke resep. Saat Anda menjalankan pipeline data, transformasinya diterapkan pada nilai dalam kolom.

Simpan baris

Jika Anda memilih untuk mempertahankan baris berdasarkan suatu kondisi, baris yang tidak memenuhi kondisi akan dihapus. Hanya baris yang memenuhi kondisi tersebut yang tetap berada di {i>dataset<i} aslinya. Misalnya, jika Anda memilih value is dan memasukkan kondisi Customer, Wrangler menyimpan baris yang berisi string Customer dan menghapusnya baris dengan nilai-nilai lain.

Hapus baris

Jika Anda memilih untuk menghapus baris berdasarkan suatu kondisi, baris yang memenuhi kondisi tersebut akan dihapus dari {i>dataset<i}. Misalnya, jika Anda menghapus baris dan memilih value kosong, Wrangler menghapus baris dari kolom yang memiliki baris kosong atau null masing-masing.

Kondisi filter yang didukung

Anda dapat memfilter baris berdasarkan kondisi berikut:

Kondisi Deskripsi
nilai kosong Menyimpan atau menghapus nilai yang memiliki nilai kosong.
nilainya adalah Menyimpan atau menghapus nilai dengan nilai yang ditentukan secara tepat. Untuk kolom yang berisi tipe data {i>string<i}, Anda dapat memilih untuk mengabaikan huruf besar/kecil. Tujuan defaultnya adalah menyertakan kasus dalam kondisi.
nilai berisi Menyimpan atau menghapus nilai yang berisi nilai yang ditentukan.
nilainya diawali dengan Menyimpan atau menghapus nilai yang dimulai dengan nilai yang ditentukan.
nilai diakhiri dengan Menyimpan atau menghapus nilai yang diakhiri dengan nilai yang ditentukan.
cocok dengan ekspresi reguler Menyimpan atau menghapus nilai yang cocok dengan ekspresi reguler.
kondisi kustom Menyimpan atau menghapus nilai yang cocok dengan kondisi kustom.

Langkah selanjutnya