Esta página explica como codificar e descodificar linhas quando prepara dados no espaço de trabalho do Wrangler do Cloud Data Fusion Studio.
Codifique uma linha
Pode usar a codificação base de dados para armazenar ou transferir dados em ambientes que, por motivos de compatibilidade com versões anteriores, estão restritos a dados US-ASCII. Pode usá-lo em novas aplicações sem essas restrições antigas, uma vez que permite a manipulação de objetos com editores de texto.
Pode aplicar os seguintes esquemas de codificação, que se baseiam na RFC-4648, a todos os valores numa coluna:
- Base32
- Base64
- Hexadecimal
- URL
Quando codifica, o Wrangler gera uma nova coluna com um nome no seguinte formato: <column>_encode_<type> except for url-encode
.
O Cloud Data Fusion usa as seguintes regras para os valores das colunas:
- Se a coluna for
null
, a coluna resultante também énull
. - Se a coluna escolhida não for encontrada na linha, a linha é ignorada.
- Se o valor da coluna não tiver um tipo de dados de string ou byte, a transformação falha e é apresentado um erro.
Opções de codificação suportadas
O Wrangler suporta as seguintes opções de codificação:
- Codificar em base64
- A opção Base64 adiciona a diretiva
encode64
como um passo de transformação à receita e cria uma nova coluna com valores codificados. - Codificar base32
- A opção Base32 adiciona a diretiva
encode32
como um passo de transformação à receita e cria uma nova coluna com valores codificados. - Codificar hexadecimal
- A opção Hex adiciona a diretiva
encode_hex
como um passo de transformação à receita e cria uma nova coluna com valores codificados. - Codificar URL
- A opção URL adiciona a diretiva
url-encode
como um passo de transformação à receita e codifica a coluna atual.
Descodifique uma linha
Pode usar a descodificação base de dados para armazenar ou transferir dados em ambientes que, por motivos de compatibilidade com versões anteriores, estão restritos a dados US-ASCII. Pode usá-lo em novas aplicações sem essas restrições antigas, uma vez que permite a manipulação de objetos com editores de texto.
Pode aplicar os seguintes esquemas de descodificação, que se baseiam na RFC-4648, a cada valor numa coluna:
- Base32
- Base64
- Hexadecimal
- URL
Quando descodifica, o Wrangler gera uma nova coluna com um nome no seguinte formato: <column>_encode_<type>
, exceto para url-decode
.
O Cloud Data Fusion usa as seguintes regras para os valores das colunas:
- Se a coluna for
null
, a coluna resultante também énull
. - Se a coluna escolhida não for encontrada na linha, a linha é ignorada.
- Se o valor da coluna não contiver os tipos de dados de string ou matriz de bytes, a operação falha.
Opções de descodificação suportadas
O Wrangler suporta as seguintes opções de codificação:
- Descodificar base64
- A opção base64 adiciona a diretiva
decode64
como um passo de transformação à receita e cria uma nova coluna com os valores descodificados. - Descodificar base32
- A opção base32 adiciona a diretiva
decode32
como um passo de transformação à receita e cria uma nova coluna com os valores descodificados. - Descodificar hexadecimal
- A opção Hex adiciona a diretiva
decode hex
como um passo de transformação à receita e cria uma nova coluna com os valores descodificados. - Descodificar URL
- A opção URL adiciona a diretiva
url-decode
como um passo de transformação à receita e descodifica a coluna atual.
O que se segue?
- Saiba mais acerca das diretivas do Wrangler.