En esta página se explica cómo codificar y decodificar filas al preparar datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.
Codificar una fila
Puedes usar la codificación base de datos para almacenar o transferir datos en entornos que, por motivos antiguos, están restringidos a datos US-ASCII. Puedes usarlo en nuevas aplicaciones sin esas restricciones antiguas, ya que permite manipular objetos con editores de texto.
Puede aplicar los siguientes esquemas de codificación, que se basan en RFC-4648, a todos los valores de una columna:
- Base32
- Base64
- Hex
- URL
Cuando codificas, Wrangler genera una nueva columna con un nombre en el siguiente formato: <column>_encode_<type> except for url-encode
.
Cloud Data Fusion usa las siguientes reglas para los valores de las columnas:
- Si la columna es
null
, la columna resultante también seránull
. - Si la columna elegida no se encuentra en la fila, se omitirá.
- Si el valor de la columna no tiene un tipo de datos de cadena o de byte, la transformación falla y se muestra un error.
Opciones de codificación admitidas
Wrangler admite las siguientes opciones de codificación:
- Codificación Base64
- La opción Base64 añade la directiva
encode64
como paso de transformación a la receta y crea una columna con valores codificados. - Codificar en base32
- La opción Base32 añade la directiva
encode32
como paso de transformación a la receta y crea una columna con los valores codificados. - Codificar hexadecimal
- La opción Hexadecimal añade la directiva
encode_hex
como paso de transformación a la receta y crea una columna con valores codificados. - Codificar URL
- La opción URL añade la directiva
url-encode
como paso de transformación a la receta y codifica la columna actual.
Decodificar una fila
Puedes usar la decodificación base de datos para almacenar o transferir datos en entornos que, por motivos antiguos, están restringidos a datos US-ASCII. Puedes usarlo en nuevas aplicaciones sin esas restricciones antiguas, ya que permite manipular objetos con editores de texto.
Puedes aplicar los siguientes esquemas de decodificación, que se basan en RFC-4648, a cada valor de una columna:
- Base32
- Base64
- Hex
- URL
Cuando decodificas, Wrangler genera una columna con un nombre en el siguiente formato: <column>_encode_<type>
, excepto en el caso de url-decode
.
Cloud Data Fusion usa las siguientes reglas para los valores de las columnas:
- Si la columna es
null
, la columna resultante también seránull
. - Si la columna elegida no se encuentra en la fila, se omitirá.
- Si el valor de la columna no contiene los tipos de datos de cadena o de matriz de bytes, la operación falla.
Opciones de decodificación admitidas
Wrangler admite las siguientes opciones de codificación:
- Decodificar base64
- La opción base64 añade la directiva
decode64
como paso de transformación a la receta y crea una columna con los valores decodificados. - Decodificar base32
- La opción base32 añade la directiva
decode32
como paso de transformación a la receta y crea una columna con los valores decodificados. - Decodificar hexadecimal
- La opción Hex añade la directiva
decode hex
como paso de transformación a la receta y crea una columna con los valores decodificados. - Decodificar URL
- La opción URL añade la directiva
url-decode
como paso de transformación a la receta y decodifica la columna actual.