Função LEN

Retorna o número de caracteres em uma string especificada. O valor de string pode ser uma referência de coluna ou literal de string.

Uso básico

Exemplo de referência de coluna:

derive type:single value:LEN(MyName)

Saída: o número de caracteres no valor na coluna MyName é gravado em uma nova coluna.

Exemplo de literal de string:

derive type:single value:LEN('Hello, World')

Saída: o valor 12 é gravado na nova coluna.

Sintaxe

derive type:single value:LEN(column_string)

ArgumentoObrigatório?Tipo de dadosDescrição
column_stringSstringNome da coluna ou literal de string a ser aplicado à função

Para saber mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

column_string

Nome de coluna ou constante de string a ser pesquisada.

  • Valores ausentes de coluna ou string geram resultados de string ausentes.
  • É necessário colocar as constantes de string entre aspas ('Hello, World').
  • Várias colunas e caracteres curinga não são aceitos.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimLiteral de string ou referência de colunamyColumn

Exemplos

Exemplo - Strings de comprimento fixo

Fonte:

Os identificadores de produto seguem uma estrutura específica que você precisa validar na receita. Nos dados do exemplo a seguir, a coluna productId precisa conter valores de comprimento 6.

Você pode ver que já existe uma coluna que contém erros de validação para a coluna ProductName. Sinalize os valores na coluna ProductId que não têm esse comprimento em uma nova coluna. Depois, será necessário juntar as duas colunas para criar uma coluna ValidationError.

ProductNameProductIdErrProductName
Coelho de chocolate123456Error-ProductName
Esquilo de chocolate88442286Error-ProductName
Roedor de chocolate12345

Transformação:

Para validar o comprimento dos valores em ProductId, digite a seguinte transformação. Observe que o parâmetro as permite que você renomeie a coluna como parte da transformação.

derive type:single value: IF(LEN(ProductId) <> 6, 'Error-length-ProductId','') '' as: 'ErrProductIdLength'

O conjunto de dados agora se parece com o seguinte:

ProductNameProductIdErrProductNameErrProductIdLength
Coelho de chocolate123456Error-ProductName
Esquilo de chocolate88442286Error-ProductNameError-length-ProductId
Roedor de chocolate12345 Error-length-ProductId

Você pode misturar as duas colunas de erro em uma única coluna de erro DataValidationErrors usando a seguinte transformação merge. Observe novamente o uso do parâmetro as:

merge col:ErrProductName,ErrProductIdlength with:' ' as:'DataValidationErrors'

Para limpar os dados, você pode seguir o exemplo abaixo, o que elimina o espaço em branco na coluna DataValidationErrors e remove as duas colunas de erro individuais:

set col:DataValidationErrors value:TRIM(DataValidationErrors)

drop col:ErrProductName

drop col:ErrProductIdLength

Resultados:

O conjunto de dados final será como o exibido abaixo:

ProductNameProductIdDataValidationErrors
Coelho de chocolate123456Error-ProductName
Esquilo de chocolate88442286Error-ProductName Error-length-ProductId
Roedor de chocolate12345Error-length-ProductId

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.