Halaman ini menjelaskan cara menyaring data ketika Anda menyiapkan data di Wrangler ruang kerja Cloud Data Fusion Studio. Di Wrangler, Anda dapat memfilter baris data di kolom jenis data apa pun, kecuali jenis boolean. Anda menyimpan atau menghapus baris berdasarkan kondisi yang Anda konfigurasi.
Untuk menyimpan atau menghapus baris berdasarkan kondisi, ikuti langkah-langkah berikut:
- Buka ruang kerja Wrangler di Cloud Data Fusion.
- Pada tab Data, buka nama kolom, lalu klik arrow_drop_down panah peluas.
- Pilih Filter, lalu pilih opsi—misalnya, Simpan baris dan Jika nilai berisi.
- Tentukan kondisi.
- Klik Terapkan.
Nilainya berubah berdasarkan filter. Wrangler menambahkan filter-rows-on
direktif ke resep. Saat Anda menjalankan
pipeline data, transformasinya
diterapkan pada nilai
dalam kolom.
Simpan baris
Jika Anda memilih untuk mempertahankan baris berdasarkan suatu kondisi, baris yang tidak memenuhi
kondisi akan dihapus. Hanya baris yang memenuhi kondisi tersebut yang tetap berada di
{i>dataset<i} aslinya. Misalnya, jika Anda memilih value is dan memasukkan kondisi
Customer
, Wrangler menyimpan baris yang berisi string Customer
dan menghapusnya
baris dengan nilai-nilai lain.
Hapus baris
Jika Anda memilih untuk menghapus baris berdasarkan suatu kondisi, baris yang memenuhi kondisi tersebut akan dihapus dari {i>dataset<i}. Misalnya, jika Anda menghapus baris dan memilih value kosong, Wrangler menghapus baris dari kolom yang memiliki baris kosong atau null masing-masing.
Kondisi filter yang didukung
Anda dapat memfilter baris berdasarkan kondisi berikut:
Kondisi | Deskripsi |
---|---|
nilai kosong | Menyimpan atau menghapus nilai yang memiliki nilai kosong. |
nilainya adalah | Menyimpan atau menghapus nilai dengan nilai yang ditentukan secara tepat. Untuk kolom yang berisi tipe data {i>string<i}, Anda dapat memilih untuk mengabaikan huruf besar/kecil. Tujuan defaultnya adalah menyertakan kasus dalam kondisi. |
nilai berisi | Menyimpan atau menghapus nilai yang berisi nilai yang ditentukan. |
nilainya diawali dengan | Menyimpan atau menghapus nilai yang dimulai dengan nilai yang ditentukan. |
nilai diakhiri dengan | Menyimpan atau menghapus nilai yang diakhiri dengan nilai yang ditentukan. |
cocok dengan ekspresi reguler | Menyimpan atau menghapus nilai yang cocok dengan ekspresi reguler. |
kondisi kustom | Menyimpan atau menghapus nilai yang cocok dengan kondisi kustom. |
Langkah selanjutnya
- Pelajari perintah Wrangler lebih lanjut.