Codificar y decodificar filas

En esta página se explica cómo codificar y decodificar filas al preparar datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.

Codificar una fila

Puedes usar la codificación base de datos para almacenar o transferir datos en entornos que, por motivos antiguos, están restringidos a datos US-ASCII. Puedes usarlo en nuevas aplicaciones sin esas restricciones antiguas, ya que permite manipular objetos con editores de texto.

Puede aplicar los siguientes esquemas de codificación, que se basan en RFC-4648, a todos los valores de una columna:

  • Base32
  • Base64
  • Hex
  • URL

Cuando codificas, Wrangler genera una nueva columna con un nombre en el siguiente formato: <column>_encode_<type> except for url-encode.

Cloud Data Fusion usa las siguientes reglas para los valores de las columnas:

  • Si la columna es null, la columna resultante también será null.
  • Si la columna elegida no se encuentra en la fila, se omitirá.
  • Si el valor de la columna no tiene un tipo de datos de cadena o de byte, la transformación falla y se muestra un error.

Opciones de codificación admitidas

Wrangler admite las siguientes opciones de codificación:

Codificación Base64
La opción Base64 añade la directiva encode64 como paso de transformación a la receta y crea una columna con valores codificados.
Codificar en base32
La opción Base32 añade la directiva encode32 como paso de transformación a la receta y crea una columna con los valores codificados.
Codificar hexadecimal
La opción Hexadecimal añade la directiva encode_hex como paso de transformación a la receta y crea una columna con valores codificados.
Codificar URL
La opción URL añade la directiva url-encode como paso de transformación a la receta y codifica la columna actual.

Decodificar una fila

Puedes usar la decodificación base de datos para almacenar o transferir datos en entornos que, por motivos antiguos, están restringidos a datos US-ASCII. Puedes usarlo en nuevas aplicaciones sin esas restricciones antiguas, ya que permite manipular objetos con editores de texto.

Puedes aplicar los siguientes esquemas de decodificación, que se basan en RFC-4648, a cada valor de una columna:

  • Base32
  • Base64
  • Hex
  • URL

Cuando decodificas, Wrangler genera una columna con un nombre en el siguiente formato: <column>_encode_<type>, excepto en el caso de url-decode.

Cloud Data Fusion usa las siguientes reglas para los valores de las columnas:

  • Si la columna es null, la columna resultante también será null.
  • Si la columna elegida no se encuentra en la fila, se omitirá.
  • Si el valor de la columna no contiene los tipos de datos de cadena o de matriz de bytes, la operación falla.

Opciones de decodificación admitidas

Wrangler admite las siguientes opciones de codificación:

Decodificar base64
La opción base64 añade la directiva decode64 como paso de transformación a la receta y crea una columna con los valores decodificados.
Decodificar base32
La opción base32 añade la directiva decode32 como paso de transformación a la receta y crea una columna con los valores decodificados.
Decodificar hexadecimal
La opción Hex añade la directiva decode hex como paso de transformación a la receta y crea una columna con los valores decodificados.
Decodificar URL
La opción URL añade la directiva url-decode como paso de transformación a la receta y decodifica la columna actual.

Siguientes pasos