Trabalhar com números

Nesta página, explicamos como realizar cálculos numéricos ao preparar dados no espaço de trabalho do Wrangler no Cloud Data Fusion Studio.

É possível realizar essas transformações em colunas dos seguintes tipos de dados:

  • Número inteiro
  • Decimal
  • Duplo
  • Ponto flutuante
  • Longo
  • Curta

Para mais informações, consulte a diretiva set-column.

É possível usar funções numéricas em uma ou mais colunas. As funções numéricas disponíveis variam de acordo com o número de colunas selecionadas. Você pode criar uma nova coluna com os resultados dos cálculos ou fazer com que os resultados apareçam na coluna em que você adiciona a transformação.

Se você aplicar uma função numérica a uma única coluna, o comportamento será diferente do que se aplicar uma função numérica a várias colunas. Exemplo:

  • Se você usar a função Multiply() em uma única coluna, especifique o valor decimal para multiplicar cada valor na coluna. O Wrangler realiza a multiplicação nos dados de amostra e exibe os novos valores na mesma coluna ou em uma nova coluna.
  • Se você usar a função Multiply() em várias colunas, o Wrangler vai multiplicar os valores em cada linha das colunas selecionadas e mostrar os novos valores na primeira coluna da transformação.

Fazer cálculos numéricos em valores de uma coluna

Para aplicar um cálculo numérico a uma coluna, siga estas etapas:

  1. Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. Na guia Dados, acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
  3. Selecione Calcular e escolha uma opção, por exemplo, Adicionar.

    Para concluir o cálculo, algumas funções exigem que você insira um valor decimal. Por exemplo, se você selecionar Subtrair, insira o valor a ser subtraído de cada linha.

  4. Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna.

  5. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como uma etapa na receita. Por exemplo, se você subtrair dois de cada valor na coluna Price, o Wrangler vai adicionar a seguinte transformação à receita:

set-column :Price Price - 2

Quando você executa o pipeline de dados, a transformação é aplicada a todos os valores na coluna.

Cálculos com suporte para uma coluna

É possível realizar os seguintes cálculos em todos os valores de uma coluna:

Função Descrição
Valor absoluto Retorna o valor absoluto de cada valor em uma coluna. Por exemplo, o valor absoluto de -10 é 10.
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Arccos Retorna o inverso do cosseno de cada valor em uma coluna.
Arcsin Retorna o inverso de seno para cada valor em uma coluna.
Arctan Retorna o inverso da tangente para cada valor em uma coluna.
Ceil Retorna o menor número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o Ceil vai retornar 3. Se o valor for 5,88, o Ceil vai retornar 6. Se o valor for -5,15, o Ceil vai retornar -5.
Cos Retorna o cosseno de cada valor de coluna.
Cubo Elevar cada valor na coluna à potência 3.
Raiz cúbica Retorna a raiz cúbica de cada valor na coluna.
Dividir Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas.
Andar Retorna o maior número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o FLOOR vai retornar 2. Se o valor for 5,88, o FLOOR vai retornar 5. Da mesma forma, se o valor for -5,15, o FLOOR vai retornar -6.
Registro Retorna o logaritmo de cada valor em uma coluna.
Módulo Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.
Registro natural Retorna o logaritmo natural de cada valor em uma coluna.
Potência de Elevar o valor da coluna à potência especificada.
Aleatório Gera valores de Double aleatórios e imprevisíveis em uma coluna especificada.
Round Arredonda cada valor em uma coluna.
Pecado Retorna o seno de cada valor em uma coluna.
Square Elevar cada valor na coluna à potência 2.
Raiz quadrada Retorna a raiz quadrada de cada valor em uma coluna.
Subtrair Subtrai um decimal positivo ou negativo de cada valor na coluna.
Tan Retorna a tangente de cada valor em uma coluna.

Fazer cálculos numéricos em valores de duas colunas

Para aplicar um cálculo numérico a duas colunas, siga estas etapas:

  1. Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
  3. Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
  4. Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
  5. Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados substituirão os valores atuais.
  6. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha das colunas Q1_Sales e Q2_Sales e criar uma nova coluna chamada H1_Sales, o Wrangler vai adicionar a seguinte transformação à receita:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna chamada H1_Sales com o total de Q1_Sales e Q2_Sales.

Cálculos com suporte em duas colunas

É possível realizar os seguintes cálculos numéricos nos valores de cada linha em duas colunas:

Função Descrição
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Média Retorna a média de cada linha em várias colunas.
Dividir Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas.
Igual Função booleana que compara duas colunas para saber se os valores correspondem, linha por linha. Retorna true ou false.
LCM Retorna o mínimo múltiplo comum de cada número em duas colunas.
Max Retorna o valor máximo de cada linha em duas colunas.
Mín. Retorna o valor mínimo de cada linha em duas colunas.
Módulo Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.
Subtrair Subtrai um decimal positivo ou negativo de cada valor na coluna.

Realizar cálculos numéricos em valores de três ou mais colunas

O Cloud Data Fusion oferece suporte à realização de cálculos numéricos em valores em três ou mais colunas na versão 6.8.0 e mais recentes.

Para aplicar um cálculo numérico a três ou mais colunas, siga estas etapas:

  1. Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
  3. Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
  4. Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
  5. Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados substituirão os valores atuais.
  6. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha das colunas Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales e criar uma nova coluna chamada 2022_Sales, o Wrangler vai adicionar a seguinte transformação à receita:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna chamada 2022_Sales com o total de Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales.

Cálculos com suporte em três ou mais colunas

É possível realizar os cálculos a seguir nos valores de cada linha em três ou mais colunas:

Função Descrição
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Média Retorna a média de cada linha em várias colunas.
Igual Função booleana que compara duas colunas para saber se os valores correspondem, linha por linha. Retorna true ou false.
Max Retorna o valor máximo de cada linha em duas colunas.
Mín. Retorna o valor mínimo de cada linha em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.

A seguir