Cómo codificar y decodificar filas

En esta página, se explica cómo codificar y decodificar filas cuando preparas datos en el lugar de trabajo de Wrangler de Cloud Data Fusion Studio.

Cómo codificar una fila

Puedes usar la codificación de base de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite la manipulación de objetos con editores de texto.

Puedes aplicar los siguientes esquemas de codificación, que se basan en la RFC-4648, a todos los valores de una columna:

  • Base32
  • Base64
  • Hexadecimal
  • URL

Cuando codificas, Wrangler genera una columna nueva con un nombre en el siguiente formato: <column>_encode_<type> except for url-encode.

Cloud Data Fusion usa las siguientes reglas para los valores de columna:

  • Si la columna es null, la columna resultante también es null.
  • Si no se encuentra la columna elegida en la fila, se omite.
  • Si el valor de la columna no tiene un tipo de datos de cadena o byte, la transformación falla y se muestra un error.

Opciones de codificación compatibles

Wrangler admite las siguientes opciones de codificación:

Codificación en base64
La opción Base64 agrega la directiva encode64 como un paso de transformación a la receta y crea una columna nueva con valores codificados.
Codifica en base32
La opción Base32 agrega la directiva encode32 como un paso de transformación a la receta y crea una columna nueva con valores codificados.
Codifica hexadecimal
La opción Hex agrega la directiva encode_hex como un paso de transformación a la receta y crea una columna nueva con valores codificados.
Cómo codificar una URL
La opción URL agrega la directiva url-encode como un paso de transformación a la receta y codifica la columna actual.

Cómo decodificar una fila

Puedes usar la decodificación básica de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite la manipulación de objetos con editores de texto.

Puedes aplicar los siguientes esquemas de decodificación, que se basan en la RFC-4648, a cada valor de una columna:

  • Base32
  • Base64
  • Hexadecimal
  • URL

Cuando decodificas, Wrangler genera una columna nueva con un nombre en el siguiente formato: <column>_encode_<type>, excepto por url-decode.

Cloud Data Fusion usa las siguientes reglas para los valores de columna:

  • Si la columna es null, la columna resultante también es null.
  • Si no se encuentra la columna elegida en la fila, se omite.
  • Si el valor de la columna no contiene los tipos de datos de cadena o array de bytes, la operación fallará.

Opciones de decodificación compatibles

Wrangler admite las siguientes opciones de codificación:

Decodifica base64
La opción base64 agrega la directiva decode64 como un paso de transformación a la receta y crea una columna nueva con los valores decodificados.
Decodifica base32
La opción base32 agrega la directiva decode32 como un paso de transformación a la receta y crea una columna nueva con los valores decodificados.
Decodificar hexadecimal
La opción Hex agrega la directiva decode hex como un paso de transformación a la receta y crea una columna nueva con los valores decodificados.
Cómo decodificar una URL
La opción URL agrega la directiva url-decode como un paso de transformación a la receta y decodifica la columna actual.

¿Qué sigue?