Função UNICODE

Gera o valor de índice Unicode para o primeiro caractere da string de entrada.
  • Unicode é um padrão digital para a codificação consistente de sistemas mundiais de escrita, de modo que a representação de conjuntos de caracteres seja consistente em todo o mundo.
  • Os primeiros 256 caracteres Unicode (0 a 255) correspondem ao conjunto de caracteres ASCII.
  • Se não conseguir resolver um caractere Unicode do primeiro caractere, a função retornará um valor nulo.

Uso básico

Exemplo de referência de coluna:

derive type:single value:UNICODE(MyChar)

Resultado: o valor de índice Unicode para o primeiro caractere na coluna MyChar é gravado na nova coluna.

Exemplo de literal de string:

derive type:single value:UNICODE('A')

Resultado: o inteiro65 é gravado na nova coluna.

Sintaxe

derive type:single value:UNICODE(column_string)

ArgumentoObrigatório?Tipo de dadosDescrição
column_stringSstringNome da coluna ou literal de string cujo valor Unicode é gerado

Para mais informações sobre os padrões de sintaxe, consulte as Notas de sintaxe da documentação da linguagem.

column_string

Nome da coluna ou literal de string, o primeiro caractere do qual é convertido no respectivo valor Unicode.

OBSERVAÇÃO: se a string de entrada contiver vários caracteres, o primeiro caractere será mapeado para o respectivo valor Unicode, e o restante será ignorado.

  • Os valores ausentes de string ou de coluna geram resultados de string ausentes.
  • É necessário colocar as constantes de string entre aspas ('Hello, World').
  • Várias colunas e caracteres curinga não são aceitos.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimLiteral de string ou referência de colunamyColumn

Exemplos

Exemplo: funções char e unicode

Neste exemplo, você verá como a função CHAR pode ser usada para converter valores de índice numéricos em caracteres Unicode e como a função UNICODE pode ser usada para reverter os caracteres para valores numéricos.

Origem:

A coluna a seguir contém alguns valores de índice de origem:

index
1
33
33.5
34
48
57
65
90
97
121
254
255
256
257
9998
9999

Transformação:

Quando os valores acima são importados para a página "Transformer", o tipo da coluna é definido como inteiro, com um único valor sem correspondência (33.5). Para ver os caracteres Unicode correspondentes para esses caracteres, digite a transformação abaixo:

derive type:single value: CHAR(index) as: 'char_index'

Para ver como esses caracteres são mapeados de volta aos valores do índice, adicione agora a transformação abaixo:

derive type:single value: UNICODE(char_index) as: 'unicode_char_index'

Resultados:

indexchar_indexunicode_char_index
1 1
33!33
33.5
34"34
48048
57957
65A65
90Z90
97a97
122z122
254þ254
255ÿ255
256Ā256
257ā257
99989998
99999999

Observe que o valor da entrada de ponto flutuante não foi processado.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.