Codificar y decodificar filas

En esta página, se explica cómo codificar y decodificar filas cuando preparas datos en el lugar de trabajo de Wrangler de Cloud Data Fusion Studio.

Codifica una fila

Puedes usar la codificación base de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos de US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite y manipular objetos con editores de texto.

Puedes aplicar los siguientes esquemas de codificación, que se basan en RFC-4648. a todos los valores de una columna:

  • Base32
  • Base64
  • Hexadecimal
  • URL

Cuando codificas, Wrangler genera una columna nueva con un nombre en el siguiente formato: <column>_encode_<type> except for url-encode.

Cloud Data Fusion usa las siguientes reglas para los valores de columna:

  • Si la columna es null, la columna resultante también es null.
  • Si no se encuentra la columna elegida en la fila, se omite.
  • Si el valor de la columna no tiene un tipo de dato cadena o byte, el la transformación falla y aparece un error.

Opciones de codificación compatibles

Wrangler admite las siguientes opciones de codificación:

Codifica en base64
La opción Base64 agrega la directiva encode64 como un paso de transformación. a la receta y crea una columna nueva con valores codificados.
Codificar en base32
La opción Base32 agrega la directiva encode32 como un paso de transformación. a la receta y crea una columna nueva con valores codificados.
Codifica hexadecimal
La opción Hexadecimal agrega la directiva encode_hex como un paso de transformación. a la receta y crea una columna nueva con valores codificados.
Cómo codificar una URL
La opción URL agrega la directiva url-encode como un paso de transformación a la receta y codifica la columna actual.

Cómo decodificar una fila

Puedes usar la decodificación base de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos de US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite y manipular objetos con editores de texto.

Puedes aplicar los siguientes esquemas de decodificación, que se basan en RFC-4648. a cada valor en una columna:

  • Base32
  • Base64
  • Hexadecimal
  • URL

Cuando realizas la decodificación, Wrangler genera una columna nueva con un nombre formato: <column>_encode_<type>, excepto url-decode.

Cloud Data Fusion usa las siguientes reglas para los valores de las columnas:

  • Si la columna es null, la columna resultante también es null.
  • Si la columna elegida no se encuentra en la fila, se omitirá la fila.
  • Si el valor de la columna no contiene los tipos de datos de cadena o array de bytes, el valor la operación falla.

Opciones de decodificación compatibles

Wrangler admite las siguientes opciones de codificación:

Decodificar en Base64
La opción base64 agrega la directiva decode64 como un paso de transformación a la receta y crea una columna nueva con los valores decodificados.
Decodificar en base32
La opción base32 agrega la directiva decode32 como un paso de transformación a la receta y crea una columna nueva con los valores decodificados.
Decodificar hexadecimal
La opción Hex agrega la directiva decode hex como un paso de transformación a la receta y crea una columna nueva con los valores decodificados.
Cómo decodificar una URL
La opción URL agrega la directiva url-decode como un paso de transformación. a la receta y decodifica la columna actual.

¿Qué sigue?