En esta página, se explica cómo codificar y decodificar filas cuando preparas datos en el lugar de trabajo de Wrangler de Cloud Data Fusion Studio.
Codifica una fila
Puedes usar la codificación base de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos de US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite y manipular objetos con editores de texto.
Puedes aplicar los siguientes esquemas de codificación, que se basan en RFC-4648. a todos los valores de una columna:
- Base32
- Base64
- Hexadecimal
- URL
Cuando codificas, Wrangler genera una columna nueva con un nombre en el siguiente formato: <column>_encode_<type> except for url-encode
.
Cloud Data Fusion usa las siguientes reglas para los valores de columna:
- Si la columna es
null
, la columna resultante también esnull
. - Si no se encuentra la columna elegida en la fila, se omite.
- Si el valor de la columna no tiene un tipo de dato cadena o byte, el la transformación falla y aparece un error.
Opciones de codificación compatibles
Wrangler admite las siguientes opciones de codificación:
- Codifica en base64
- La opción Base64 agrega la directiva
encode64
como un paso de transformación. a la receta y crea una columna nueva con valores codificados. - Codificar en base32
- La opción Base32 agrega la directiva
encode32
como un paso de transformación. a la receta y crea una columna nueva con valores codificados. - Codifica hexadecimal
- La opción Hexadecimal agrega la directiva
encode_hex
como un paso de transformación. a la receta y crea una columna nueva con valores codificados. - Cómo codificar una URL
- La opción URL agrega la directiva
url-encode
como un paso de transformación a la receta y codifica la columna actual.
Cómo decodificar una fila
Puedes usar la decodificación base de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos de US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite y manipular objetos con editores de texto.
Puedes aplicar los siguientes esquemas de decodificación, que se basan en RFC-4648. a cada valor en una columna:
- Base32
- Base64
- Hexadecimal
- URL
Cuando realizas la decodificación, Wrangler genera una columna nueva con un nombre
formato: <column>_encode_<type>
, excepto url-decode
.
Cloud Data Fusion usa las siguientes reglas para los valores de las columnas:
- Si la columna es
null
, la columna resultante también esnull
. - Si la columna elegida no se encuentra en la fila, se omitirá la fila.
- Si el valor de la columna no contiene los tipos de datos de cadena o array de bytes, el valor la operación falla.
Opciones de decodificación compatibles
Wrangler admite las siguientes opciones de codificación:
- Decodificar en Base64
- La opción base64 agrega la directiva
decode64
como un paso de transformación a la receta y crea una columna nueva con los valores decodificados. - Decodificar en base32
- La opción base32 agrega la directiva
decode32
como un paso de transformación a la receta y crea una columna nueva con los valores decodificados. - Decodificar hexadecimal
- La opción Hex agrega la directiva
decode hex
como un paso de transformación a la receta y crea una columna nueva con los valores decodificados. - Cómo decodificar una URL
- La opción URL agrega la directiva
url-decode
como un paso de transformación. a la receta y decodifica la columna actual.
¿Qué sigue?
- Obtén más información sobre las directivas de Wrangler.