Memfilter data

Halaman ini menjelaskan cara memfilter saat Anda menyiapkan data di ruang kerja Wrangler di Cloud Data Fusion Studio. Di Wrangler, Anda dapat memfilter baris data di kolom jenis data apa pun, kecuali jenis boolean. Anda mempertahankan atau menghapus baris berdasarkan kondisi yang Anda konfigurasikan.

Untuk mempertahankan atau menghapus baris berdasarkan kondisi, ikuti langkah-langkah berikut:

  1. Buka ruang kerja Wrangler di Cloud Data Fusion.
  2. Di tab Data, buka nama kolom, lalu klik panah peluas arrow_drop_down.
  3. Pilih Filter, lalu pilih opsi—misalnya, Keep rows dan If value contains.
  4. Tentukan kondisinya.
  5. Klik Terapkan.

Nilai berubah berdasarkan filter. Wrangler menambahkan perintah filter-rows-on ke urutan langkah. Saat Anda menjalankan pipeline data, transformasi akan diterapkan ke nilai dalam kolom.

Mempertahankan baris

Jika Anda memilih untuk mempertahankan baris berdasarkan kondisi, baris yang tidak memenuhi kondisi akan dihapus. Hanya baris yang memenuhi kondisi yang tetap ada dalam set data. Misalnya, jika Anda memilih value is dan memasukkan kondisi Customer, Wrangler akan mempertahankan baris yang berisi string Customer dan menghapus baris dengan nilai lain.

Menghapus baris

Jika Anda memilih untuk menghapus baris berdasarkan kondisi, baris yang memenuhi kondisi tersebut akan dihapus dari set data. Misalnya, jika Anda menghapus baris dan memilih value is empty, Wrangler akan menghapus baris dari kolom yang memiliki nilai kosong atau null.

Kondisi filter yang didukung

Anda dapat memfilter baris berdasarkan kondisi berikut:

Kondisi Deskripsi
value is empty Mempertahankan atau menghapus nilai dengan nilai kosong.
value is Mempertahankan atau menghapus nilai dengan nilai yang ditentukan secara tepat. Untuk kolom yang berisi jenis data string, Anda dapat memilih untuk mengabaikan huruf besar/kecil. Defaultnya adalah menyertakan huruf besar/kecil dalam kondisi.
value contains Mempertahankan atau menghapus nilai yang berisi nilai yang ditentukan.
value starts with Mempertahankan atau menghapus nilai yang dimulai dengan nilai yang ditentukan.
value ends with Mempertahankan atau menghapus nilai yang diakhiri dengan nilai yang ditentukan.
cocok dengan ekspresi reguler Mempertahankan atau menghapus nilai yang cocok dengan ekspresi reguler.
kondisi kustom Mempertahankan atau menghapus nilai yang cocok dengan kondisi kustom.

Langkah selanjutnya