Mengenkode dan mendekode baris

Halaman ini menjelaskan cara mengenkode dan mendekode baris saat Anda menyiapkan data di ruang kerja Wrangler di Cloud Data Fusion Studio.

Mengenkode baris

Anda dapat menggunakan encoding dasar data untuk menyimpan atau mentransfer data di lingkungan yang, karena alasan lama, dibatasi untuk data US-ASCII. Anda dapat menggunakannya di aplikasi baru tanpa batasan lama tersebut karena memungkinkan manipulasi objek dengan editor teks.

Anda dapat menerapkan skema encoding berikut, yang didasarkan pada RFC-4648, ke semua nilai dalam kolom:

  • Base32
  • Base64
  • Hex
  • URL

Saat Anda melakukan encoding, Wrangler akan membuat kolom baru dengan nama dalam format berikut: <column>_encode_<type> except for url-encode.

Cloud Data Fusion menggunakan aturan berikut untuk nilai kolom:

  • Jika kolomnya adalah null, kolom yang dihasilkan juga null.
  • Jika kolom yang dipilih tidak ditemukan di baris, baris akan dilewati.
  • Jika nilai kolom tidak memiliki jenis data string atau byte, transformasi akan gagal, dan error akan ditampilkan.

Opsi encoding yang didukung

Wrangler mendukung opsi encoding berikut:

Mengenkode base64
Opsi Base64 menambahkan perintah encode64 sebagai langkah transformasi ke resep dan membuat kolom baru dengan nilai yang dienkode.
Mengenkode base32
Opsi Base32 menambahkan perintah encode32 sebagai langkah transformasi ke resep dan membuat kolom baru dengan nilai yang dienkode.
Mengenkode hex
Opsi Hex menambahkan perintah encode_hex sebagai langkah transformasi ke resep dan membuat kolom baru dengan nilai yang dienkode.
Mengenkode URL
Opsi URL menambahkan perintah url-encode sebagai langkah transformasi ke resep dan mengenkode kolom saat ini.

Mendekode baris

Anda dapat menggunakan decoding dasar data untuk menyimpan atau mentransfer data di lingkungan yang, karena alasan lama, dibatasi untuk data US-ASCII. Anda dapat menggunakannya di aplikasi baru tanpa batasan lama tersebut karena memungkinkan manipulasi objek dengan editor teks.

Anda dapat menerapkan skema decoding berikut, yang didasarkan pada RFC-4648, ke setiap nilai dalam kolom:

  • Base32
  • Base64
  • Hex
  • URL

Saat Anda mendekode, Wrangler akan membuat kolom baru dengan nama dalam format berikut: <column>_encode_<type>, kecuali untuk url-decode.

Cloud Data Fusion menggunakan aturan berikut untuk nilai kolom:

  • Jika kolomnya adalah null, kolom yang dihasilkan juga null.
  • Jika kolom yang dipilih tidak ditemukan di baris, baris akan dilewati.
  • Jika nilai kolom tidak berisi jenis data string atau array byte, operasi akan gagal.

Opsi dekode yang didukung

Wrangler mendukung opsi encoding berikut:

Mendekode base64
Opsi base64 menambahkan perintah decode64 sebagai langkah transformasi ke resep dan membuat kolom baru dengan nilai yang didekode.
Mendekode base32
Opsi base32 menambahkan perintah decode32 sebagai langkah transformasi ke resep dan membuat kolom baru dengan nilai yang didekode.
Mendekode hex
Opsi Hex menambahkan perintah decode hex sebagai langkah transformasi ke resep dan membuat kolom baru dengan nilai yang didekode.
Mendekode URL
Opsi URL menambahkan perintah url-decode sebagai langkah transformasi ke resep dan mendekode kolom saat ini.

Langkah selanjutnya