Mengeksplorasi data dari kolom

Halaman ini menjelaskan cara memisahkan data dari kolom (sel) menjadi beberapa baris saat Anda menyiapkan data di ruang kerja Wrangler di Cloud Data Fusion Studio.

Memisahkan teks yang dibatasi

Anda dapat memisahkan nilai dari sel ke baris baru jika nilai tersebut dipisahkan oleh pemisah berikut:

  • Koma
  • Tab
  • Pipe
  • Spasi Kosong
  • Pemisah kustom

Jika sel tidak berisi pemisah yang dipilih, baris baru tidak akan disisipkan.

Untuk memisahkan nilai berdasarkan pemisah, ikuti langkah-langkah berikut:

  1. Buka ruang kerja Wrangler di Cloud Data Fusion.
  2. Di tab Data, buka nama kolom, lalu klik panah peluas arrow_drop_down.
  3. Klik Explode > Delimited text.
  4. Pilih pemisah—misalnya Pipa.
  5. Klik Ekstrak.

Wrangler membagi kolom berdasarkan pemisah yang dipilih dan menambahkan perintah split-to-row ke resep. Saat Anda menjalankan pipeline data, Cloud Data Fusion akan menerapkan transformasi ke semua nilai dalam kolom.

Dalam contoh ini, set data memiliki kolom nilai string yang berisi pemisah koma:

ID Nama
1 Lee,Lucian,Luka
2 Mahan,Noam

Untuk membagi nilai menjadi baris terpisah, Wrangler akan menghapus kolom asli dan membuat kolom baru dengan satu baris untuk setiap nilai. Nilai kolom lainnya dari baris asli disalin ke baris baru:

ID Name_1
1 Lee
1 Lucian
1 Luka
2 Mahan
2 Noam

Array terpisah

Perintah flatten memisahkan item dalam array, seperti ["ELEMENT_1", "ELEMENT_2", "ELEMENT_3"], menjadi baris baru. Nilai kolom lainnya dari data asli disalin ke data baru.

Langkah selanjutnya