Função IN

Retorna true se o primeiro parâmetro está contido na matriz de valores no segundo parâmetro.
  • O valor a ser combinado pode ser um literal ou uma referência a uma coluna.
  • O segundo parâmetro tem de estar no formato da matriz.

Como a função IN retorna um valor booleano, ela pode ser usada como função ou condicional.

Dica: quando você seleciona valores em um histograma para uma coluna de tipo String, a função que identifica os valores para executar uma transformação normalmente é IN.

Dica: use a função FIND se você precisar da localização do valor correspondente na fonte. Consulte Função FIND.

Uso básico

keep row: IN(brand, ['discount','mid','high-end'] )

Saída: mantém todas as linhas em que o valor na coluna brand é discount, mid ou high-end.

Sintaxe

derive type:single value:IN(column_string, values_array)

ArgumentoObrigatório?Tipo de dadosDescrição
column_stringSstringNome da coluna ou literal a localizar na coluna especificada no segundo parâmetro
values_arraySliteral de matrizLiteral de matriz de valores para pesquisar

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

column_string

Nome da coluna ou literal a encontrar no segundo parâmetro.

  • Os valores ausentes geram resultados de string ausentes.
    • É necessário colocar as constantes de string entre aspas ('Hello, World').
  • Várias colunas e caracteres curinga não são aceitos.

Notas de uso:

Obrigatório?Tipo de dadosValor de exemplo
SimReferência de coluna ou qualquer valormyColumn

values_array

Matriz de valores a procurar para o primeiro parâmetro.

  • Não há suporte para referências de colunas.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimLiteral de matriz'Steve'

Exemplos

Exemplo: substituir a cor da camiseta

Fonte:

Você tem os seguintes dados de origem sobre os produtos:

ProdIdNome do produtoCorMarca
P001camisetabrancobarata
P002calçabegebarata
P003chapéupretobarata
P004camisetabrancomédia
P005calçapretomédia
P006chapéuvermelhomédia
P007camisetabrancoalto padrão
P008calçabrancoalto padrão
P009chapéuazulalto padrão

Nos dados, você observa um erro. Para as marcas barata e média, a cor da camiseta deve ser orange. Você precisa corrigir esse erro.

Transformação:

Na página "Transformer", você seleciona o valor white partir do histograma na parte superior da coluna Color. Entre os cartões de transformação, selecione a transformação Set. Para a primeira variante, todos os valores estão ausentes. Clique em Modificar. A transformação atual é a seguinte:

set col: Color value: NULL() row: Color == 'white'

Na visualização, é possível observar que essa transformação corresponde a todos os valores white na coluna e os substitui por um valor nulo. Como o valor de substituição é orange, você pode editar a transformação para que se pareça com o seguinte:

set col: Color value: 'orange' row: Color == 'white'

Esta etapa parece melhor. No entanto, ela está substituindo todas as instâncias de white, incluindo as de calças brancas (P008) e camisetas de alto padrão (P007), que não devem ser substituídas. Para corrigir, você precisa adicionar condições à expressão row. Primeiro, adicione o seguinte código, que garante que a transformação só substitua as camisetas:

set col: Color value: 'orange' row: (Color == 'white' && ProductName == 'T-shirt')

Agora, "Preview" mostra que apenas os valores da camiseta estão sendo alterados. A transformação precisa ser modificada para restringir apenas as marcas adequadas (discount e mid):

set col: Color value: 'orange' row: (Color == 'white' && ProductName == 'T-shirt' && IN(Brand, ["discount","mid"]))

OBSERVAÇÃO: é possível especificar a restrição da marca como (Brand <> 'high-end'). No entanto, se houver outros valores de marca no conjunto de dados completo, essa restrição falhará.

Resultados:

ProdIdNome do produtoCorMarca
P001camisetalaranjabarata
P002calçabegebarata
P003chapéupretobarata
P004camisetalaranjamédia
P005calçapretomédia
P006chapéuvermelhomédia
P007camisetabrancoalto padrão
P008calçabrancoalto padrão
P009chapéuazulalto padrão

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.