Trabalhar com números

Esta página explica como realizar cálculos numéricos ao preparar dados em espaço de trabalho do Wrangler no Cloud Data Fusion Studio.

É possível realizar essas transformações em colunas dos seguintes tipos de dados:

  • Número inteiro
  • Decimal
  • Duplo
  • Ponto flutuante
  • Longo
  • Curta

Para mais informações, consulte a diretiva set-column.

É possível usar funções numéricas em uma ou mais colunas. As funções numéricas disponíveis variam de acordo com o número de colunas selecionadas. Você pode optar por criar um uma nova coluna com os resultados dos cálculos, ou você pode ter os resultados aparecem na coluna em que você adiciona a transformação.

Se você aplicar uma função numérica a uma única coluna, o comportamento será diferente do que se aplicar uma função numérica a várias colunas. Exemplo:

  • Se você usar a função Multiply() em uma única coluna, especifique o decimal pelo qual multiplicar cada valor na coluna. O Wrangler realiza multiplicação nos dados da amostra e exibe os novos valores no mesmo ou em uma nova coluna.
  • Se você usar a função Multiply() em várias colunas, o Wrangler multiplica os valores em cada linha para as colunas selecionadas e exibe os novos valores na primeira coluna da transformação.

Realizar cálculos numéricos em valores de uma coluna

Para aplicar um cálculo numérico a uma coluna, siga estas etapas:

  1. Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. Na guia Dados, vá para o nome de uma coluna e clique no arrow_drop_down seta de expansão.
  3. Selecione Calcular e escolha uma opção, por exemplo, Adicionar.

    Para concluir o cálculo, algumas funções exigem que você insira um valor decimal. Por exemplo, se você selecionar Subtrair, será necessário inserir o valor para subtrair de cada linha.

  4. Opcional: para criar uma nova coluna para os valores calculados, selecione o Caixa de seleção Copiar para uma nova coluna.

  5. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como uma etapa na receita. Por exemplo, se você subtrair dois de cada valor na coluna Price, o Wrangler adiciona a seguinte transformação ao receita:

set-column :Price Price - 2

Quando você executa o pipeline de dados, a transformação é aplicada a todos os valores em da coluna.

Cálculos com suporte para uma coluna

É possível realizar os seguintes cálculos em todos os valores de uma coluna:

Função Descrição
Valor absoluto Retorna o valor absoluto de cada valor em uma coluna. Por exemplo, o valor absoluto de -10 é 10.
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Arccos Retorna o inverso do cosseno de cada valor em uma coluna.
Arcsin Retorna o inverso do seno de cada valor em uma coluna.
Arctan Retorna o inverso da tangente para cada valor em uma coluna.
Ceil Retorna o menor número inteiro maior ou igual ao número em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o Ceil vai retornar 3. Se o valor for 5,88, o Ceil vai retornar 6. Se o valor é -5,15, e Ceil retorna -5.
Cos (link em inglês) Retorna o cosseno de cada valor de coluna.
Cubo Eleva cada valor na coluna à potência de 3.
Raiz cúbica Retorna a raiz cúbica de cada valor na coluna.
Dividir divide cada valor na coluna por um número decimal positivo ou negativo ou divide cada valor em duas colunas.
Andar Retorna o maior número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o FLOOR vai retornar 2. Se o valor for 5,88, o FLOOR vai retornar 5. Da mesma forma, se o valor for -5,15, FLOOR retornará -6.
Registro Retorna o logaritmo de cada valor em uma coluna.
Módulo Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.
Registro natural Retorna o logaritmo natural de cada valor em uma coluna.
Potência de Elevar o valor da coluna à potência especificada.
Aleatório Gera valores do tipo Double aleatórios e imprevisíveis em uma .
Round Arredonda cada valor em uma coluna.
Pecado Retorna o seno de cada valor em uma coluna.
Quadrado Elevar cada valor na coluna à potência 2.
Raiz quadrada Retorna a raiz quadrada de cada valor em uma coluna.
Subtrair Subtrai um decimal positivo ou negativo para cada valor na .
Tan (link em inglês) Retorna a tangente de cada valor em uma coluna.

Fazer cálculos numéricos em valores de duas colunas

Para aplicar um cálculo numérico a duas colunas, siga estas etapas:

  1. Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
  3. Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
  4. Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
  5. Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados vão valores existentes.
  6. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona o modelo diretiva como uma etapa no roteiro. Por exemplo, se você adicionar os valores em cada linha das colunas Q1_Sales e Q2_Sales e criar uma nova coluna chamada H1_Sales, o Wrangler adiciona a seguinte transformação ao roteiro:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna chamada H1_Sales com o total de Q1_Sales e Q2_Sales.

Cálculos compatíveis em duas colunas

Você pode realizar os seguintes cálculos numéricos em valores de cada linha em duas colunas:

Função Descrição
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Média Retorna a média de cada linha em várias colunas.
Dividir divide cada valor na coluna por um número decimal positivo ou negativo ou divide cada valor em duas colunas.
Igual Função booleana que compara duas colunas para saber se os valores correspondem, linha por linha. Retorna true ou false.
LCM Retorna o mínimo múltiplo comum de cada número em duas colunas.
Máx. Retorna o valor máximo de cada linha em duas colunas.
Mín. Retorna o valor mínimo de cada linha em duas colunas.
Módulo Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou ao dividir cada valor em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.
Subtrair Subtrai um decimal positivo ou negativo de cada valor na coluna.

Realizar cálculos numéricos em valores de três ou mais colunas

O Cloud Data Fusion oferece suporte à realização de cálculos numéricos em valores de três ou mais colunas na versão 6.8.0 e mais recentes.

Para aplicar um cálculo numérico a três ou mais colunas, siga estas etapas:

  1. Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
  3. Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
  4. Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
  5. Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados vão valores existentes.
  6. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha das colunas Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales e criar uma nova coluna chamada 2022_Sales, o Wrangler vai adicionar a seguinte transformação à receita:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna chamada 2022_Sales com o total de Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales.

Cálculos com suporte em três ou mais colunas

É possível realizar os cálculos a seguir nos valores de cada linha em três ou mais colunas:

Função Descrição
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Na média Retorna a média de cada linha em várias colunas.
Igual Função booleana que compara duas colunas para saber se os valores correspondem, linha por linha. Retorna true ou false.
Máx. Retorna o valor máximo de cada linha em duas colunas.
Mín. Retorna o valor mínimo de cada linha em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.

A seguir