Halaman ini menjelaskan cara mengenkode dan mendekode baris saat Anda menyiapkan data di ruang kerja Wrangler Cloud Data Fusion Studio.
Mengenkode baris
Anda dapat menggunakan encoding dasar data untuk menyimpan atau mentransfer data di lingkungan yang, karena alasan lama, dibatasi untuk data US-ASCII. Anda mungkin menggunakannya di aplikasi baru tanpa batasan lama tersebut karena memungkinkan manipulasi objek dengan editor teks.
Anda dapat menerapkan skema pengkodean berikut, yang didasarkan di RFC-4648, ke semua nilai dalam kolom:
- Base32
- Base64
- Hex
- URL
Saat Anda mengenkode, Wrangler akan menghasilkan kolom baru dengan nama berikut
format: <column>_encode_<type> except for url-encode
.
Cloud Data Fusion menggunakan aturan berikut untuk nilai kolom:
- Jika kolomnya adalah
null
, kolom yang dihasilkan juga adalahnull
. - Jika kolom yang dipilih tidak ditemukan dalam baris, baris tersebut akan dilewati.
- Jika nilai kolom tidak memiliki tipe data {i>string<i} atau byte, transformasi gagal, dan pesan error akan ditampilkan.
Opsi encoding yang didukung
Wrangler mendukung opsi encoding berikut:
- Mengenkode base64
- Opsi Base64 menambahkan perintah
encode64
sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang dienkode. - Mengenkode base32
- Opsi Base32 menambahkan perintah
encode32
sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang dienkode. - Mengenkode heksadesimal
- Opsi Hex menambahkan perintah
encode_hex
sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang dienkode. - URL Enkode
- Opsi URL menambahkan perintah
url-encode
sebagai langkah transformasi ke resep dan mengenkode kolom saat ini.
Mendekode baris
Anda dapat menggunakan decoding dasar data untuk menyimpan atau mentransfer data di lingkungan yang, karena alasan lama, dibatasi untuk data US-ASCII. Anda mungkin menggunakannya di aplikasi baru tanpa batasan lama tersebut karena memungkinkan manipulasi objek dengan editor teks.
Anda dapat menerapkan skema decoding berikut, yang didasarkan di RFC-4648, ke setiap nilai dalam kolom:
- Base32
- Base64
- Hex
- URL
Saat Anda melakukan dekode, Wrangler akan menghasilkan kolom baru dengan nama berikut
format: <column>_encode_<type>
, kecuali untuk url-decode
.
Cloud Data Fusion menggunakan aturan berikut untuk nilai kolom:
- Jika kolomnya adalah
null
, kolom yang dihasilkan juga adalahnull
. - Jika kolom yang dipilih tidak ditemukan di baris, baris tersebut akan dilewati.
- Jika nilai kolom tidak berisi tipe data array string atau byte, operasi gagal.
Opsi dekode yang didukung
Wrangler mendukung opsi encoding berikut:
- Dekode base64
- Opsi base64 menambahkan perintah
decode64
sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang didekode. - Dekode base32
- Opsi base32 menambahkan perintah
decode32
sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang didekode. - Dekode heksadesimal
- Opsi Hex menambahkan perintah
decode hex
sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang didekode. - URL Dekode
- Opsi URL menambahkan perintah
url-decode
sebagai langkah transformasi ke resep dan mendekode kolom saat ini.
Langkah selanjutnya
- Pelajari perintah Wrangler lebih lanjut.