Codifique e descodifique linhas

Esta página explica como codificar e descodificar linhas quando prepara dados no espaço de trabalho do Wrangler do Cloud Data Fusion Studio.

Codifique uma linha

Pode usar a codificação base de dados para armazenar ou transferir dados em ambientes que, por motivos de compatibilidade com versões anteriores, estão restritos a dados US-ASCII. Pode usá-lo em novas aplicações sem essas restrições antigas, uma vez que permite a manipulação de objetos com editores de texto.

Pode aplicar os seguintes esquemas de codificação, que se baseiam na RFC-4648, a todos os valores numa coluna:

  • Base32
  • Base64
  • Hexadecimal
  • URL

Quando codifica, o Wrangler gera uma nova coluna com um nome no seguinte formato: <column>_encode_<type> except for url-encode.

O Cloud Data Fusion usa as seguintes regras para os valores das colunas:

  • Se a coluna for null, a coluna resultante também é null.
  • Se a coluna escolhida não for encontrada na linha, a linha é ignorada.
  • Se o valor da coluna não tiver um tipo de dados de string ou byte, a transformação falha e é apresentado um erro.

Opções de codificação suportadas

O Wrangler suporta as seguintes opções de codificação:

Codificar em base64
A opção Base64 adiciona a diretiva encode64 como um passo de transformação à receita e cria uma nova coluna com valores codificados.
Codificar base32
A opção Base32 adiciona a diretiva encode32 como um passo de transformação à receita e cria uma nova coluna com valores codificados.
Codificar hexadecimal
A opção Hex adiciona a diretiva encode_hex como um passo de transformação à receita e cria uma nova coluna com valores codificados.
Codificar URL
A opção URL adiciona a diretiva url-encode como um passo de transformação à receita e codifica a coluna atual.

Descodifique uma linha

Pode usar a descodificação base de dados para armazenar ou transferir dados em ambientes que, por motivos de compatibilidade com versões anteriores, estão restritos a dados US-ASCII. Pode usá-lo em novas aplicações sem essas restrições antigas, uma vez que permite a manipulação de objetos com editores de texto.

Pode aplicar os seguintes esquemas de descodificação, que se baseiam na RFC-4648, a cada valor numa coluna:

  • Base32
  • Base64
  • Hexadecimal
  • URL

Quando descodifica, o Wrangler gera uma nova coluna com um nome no seguinte formato: <column>_encode_<type>, exceto para url-decode.

O Cloud Data Fusion usa as seguintes regras para os valores das colunas:

  • Se a coluna for null, a coluna resultante também é null.
  • Se a coluna escolhida não for encontrada na linha, a linha é ignorada.
  • Se o valor da coluna não contiver os tipos de dados de string ou matriz de bytes, a operação falha.

Opções de descodificação suportadas

O Wrangler suporta as seguintes opções de codificação:

Descodificar base64
A opção base64 adiciona a diretiva decode64 como um passo de transformação à receita e cria uma nova coluna com os valores descodificados.
Descodificar base32
A opção base32 adiciona a diretiva decode32 como um passo de transformação à receita e cria uma nova coluna com os valores descodificados.
Descodificar hexadecimal
A opção Hex adiciona a diretiva decode hex como um passo de transformação à receita e cria uma nova coluna com os valores descodificados.
Descodificar URL
A opção URL adiciona a diretiva url-decode como um passo de transformação à receita e descodifica a coluna atual.

O que se segue?