Função CHAR

Gera o caractere Unicode correspondente a um valor inteiro inserido.

Unicode é um padrão digital para a codificação consistente de sistemas mundiais de escrita, de modo que a representação de conjuntos de caracteres seja consistente em todo o mundo.

  • Os primeiros 256 caracteres Unicode (0 a 255) correspondem ao conjunto de caracteres ASCII.
  • Os valores de entrada para a função CHAR precisam ser de tipo inteiro. Os dados da coluna do tipo decimal podem ser usados como entrada. No entanto, se os dados contiverem dígitos à direita do ponto decimal, a função CHAR retornará um valor ausente.
  • Se a função não puder avaliar os dados numéricos, um valor nulo será retornado.

Uso básico

Exemplo de referência de coluna:

derive type:single value:CHAR(MyCharIndex)

Saída: o valor Unicode referente ao número na coluna MyCharIndex é gravado na nova coluna.

Exemplo de literal de string:

derive type:single value:CHAR(65)

Saída: a string A é gravada na nova coluna.

Sintaxe

derive type:single value:CHAR(index_value)

ArgumentoObrigatório?Tipo de dadosDescrição
index_valueSinteiro (positivo)Valor do índice Unicode do caractere

Para mais informações sobre os padrões de sintaxe, consulte as Observações sobre a sintaxe da documentação da linguagem.

index_value

Valor do índice Unicode do caractere para gerar ou fazer a correspondência.

  • O conjunto de caracteres Unicode contém 1.114.112 caracteres. A maioria dos usos conta com os primeiros 10.000 caracteres.
  • O valor precisa ser inferior a end_index.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimInteiro (não negativo)65

Exemplos

Exemplo: funções char e unicode

Neste exemplo, você verá como a função CHAR pode ser usada para converter valores de índice numéricos em caracteres Unicode e como a função UNICODE pode ser usada para reverter os caracteres para valores numéricos.

Origem:

A coluna a seguir contém alguns valores de índice de origem:

index
1
33
33.5
34
48
57
65
90
97
121
254
255
256
257
9998
9999

Transformação:

Quando os valores acima são importados para a página "Transformer", o tipo da coluna é definido como inteiro, com um único valor sem correspondência (33.5). Para ver os caracteres Unicode correspondentes para esses caracteres, digite a transformação abaixo:

derive type:single value: CHAR(index) as: 'char_index'

Para ver como esses caracteres são mapeados de volta aos valores do índice, adicione agora a transformação abaixo:

derive type:single value: UNICODE(char_index) as: 'unicode_char_index'

Resultados:

indexchar_indexunicode_char_index
1 1
33!33
33.5
34"34
48048
57957
65A65
90Z90
97a97
122z122
254þ254
255ÿ255
256Ā256
257ā257
99989998
99999999

Observe que o valor da entrada de ponto flutuante não foi processado.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.