Mengenkode dan mendekode baris

Halaman ini menjelaskan cara mengenkode dan mendekode baris saat Anda menyiapkan data di ruang kerja Wrangler Cloud Data Fusion Studio.

Mengenkode baris

Anda dapat menggunakan encoding dasar data untuk menyimpan atau mentransfer data di lingkungan yang, karena alasan lama, dibatasi untuk data US-ASCII. Anda mungkin menggunakannya di aplikasi baru tanpa batasan lama tersebut karena memungkinkan manipulasi objek dengan editor teks.

Anda dapat menerapkan skema pengkodean berikut, yang didasarkan di RFC-4648, ke semua nilai dalam kolom:

  • Base32
  • Base64
  • Hex
  • URL

Saat Anda mengenkode, Wrangler akan menghasilkan kolom baru dengan nama berikut format: <column>_encode_<type> except for url-encode.

Cloud Data Fusion menggunakan aturan berikut untuk nilai kolom:

  • Jika kolomnya adalah null, kolom yang dihasilkan juga adalah null.
  • Jika kolom yang dipilih tidak ditemukan dalam baris, baris tersebut akan dilewati.
  • Jika nilai kolom tidak memiliki tipe data {i>string<i} atau byte, transformasi gagal, dan pesan error akan ditampilkan.

Opsi encoding yang didukung

Wrangler mendukung opsi encoding berikut:

Mengenkode base64
Opsi Base64 menambahkan perintah encode64 sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang dienkode.
Mengenkode base32
Opsi Base32 menambahkan perintah encode32 sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang dienkode.
Mengenkode heksadesimal
Opsi Hex menambahkan perintah encode_hex sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang dienkode.
URL Enkode
Opsi URL menambahkan perintah url-encode sebagai langkah transformasi ke resep dan mengenkode kolom saat ini.

Mendekode baris

Anda dapat menggunakan decoding dasar data untuk menyimpan atau mentransfer data di lingkungan yang, karena alasan lama, dibatasi untuk data US-ASCII. Anda mungkin menggunakannya di aplikasi baru tanpa batasan lama tersebut karena memungkinkan manipulasi objek dengan editor teks.

Anda dapat menerapkan skema decoding berikut, yang didasarkan di RFC-4648, ke setiap nilai dalam kolom:

  • Base32
  • Base64
  • Hex
  • URL

Saat Anda melakukan dekode, Wrangler akan menghasilkan kolom baru dengan nama berikut format: <column>_encode_<type>, kecuali untuk url-decode.

Cloud Data Fusion menggunakan aturan berikut untuk nilai kolom:

  • Jika kolomnya adalah null, kolom yang dihasilkan juga adalah null.
  • Jika kolom yang dipilih tidak ditemukan di baris, baris tersebut akan dilewati.
  • Jika nilai kolom tidak berisi tipe data array string atau byte, operasi gagal.

Opsi dekode yang didukung

Wrangler mendukung opsi encoding berikut:

Dekode base64
Opsi base64 menambahkan perintah decode64 sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang didekode.
Dekode base32
Opsi base32 menambahkan perintah decode32 sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang didekode.
Dekode heksadesimal
Opsi Hex menambahkan perintah decode hex sebagai langkah transformasi ke urutan langkah dan membuat kolom baru dengan nilai yang didekode.
URL Dekode
Opsi URL menambahkan perintah url-decode sebagai langkah transformasi ke resep dan mendekode kolom saat ini.

Langkah selanjutnya