Halaman ini menjelaskan cara memisahkan data dari kolom (sel) menjadi beberapa baris saat Anda menyiapkan data di ruang kerja Wrangler di Cloud Data Fusion Studio.
Memisahkan teks yang dibatasi
Anda dapat memisahkan nilai dari sel ke baris baru jika nilai tersebut dipisahkan oleh pemisah berikut:
- Koma
- Tab
- Pipe
- Spasi Kosong
- Pemisah kustom
Jika sel tidak berisi pemisah yang dipilih, baris baru tidak akan disisipkan.
Untuk memisahkan nilai berdasarkan pemisah, ikuti langkah-langkah berikut:
- Buka ruang kerja Wrangler di Cloud Data Fusion.
- Di tab Data, buka nama kolom, lalu klik panah peluas arrow_drop_down.
- Klik Explode > Delimited text.
- Pilih pemisah—misalnya Pipa.
Klik Ekstrak.
Wrangler membagi kolom berdasarkan pemisah yang dipilih dan menambahkan
perintah split-to-row
ke resep. Saat Anda menjalankan pipeline data,
Cloud Data Fusion akan menerapkan transformasi ke semua nilai dalam kolom.
Dalam contoh ini, set data memiliki kolom nilai string yang berisi pemisah koma:
ID | Nama |
---|---|
1 | Lee,Lucian,Luka |
2 | Mahan,Noam |
Untuk membagi nilai menjadi baris terpisah, Wrangler akan menghapus kolom asli dan membuat kolom baru dengan satu baris untuk setiap nilai. Nilai kolom lainnya dari baris asli disalin ke baris baru:
ID | Name_1 |
---|---|
1 | Lee |
1 | Lucian |
1 | Luka |
2 | Mahan |
2 | Noam |
Array terpisah
Perintah flatten
memisahkan item dalam array, seperti ["ELEMENT_1",
"ELEMENT_2", "ELEMENT_3"]
, menjadi baris baru. Nilai kolom lainnya dari
data asli disalin ke data baru.
Langkah selanjutnya
- Pelajari lebih lanjut Perintah Wrangler.