Trabalhe com números

Esta página explica como fazer cálculos numéricos quando prepara dados no espaço de trabalho do Wrangler do Cloud Data Fusion Studio.

Pode fazer estas transformações em colunas dos seguintes tipos de dados:

  • Número inteiro
  • Decimal
  • Duplo
  • Flutuante
  • Longo
  • Curto

Para mais informações, consulte a diretiva set-column.

Pode usar funções numéricas numa ou mais colunas. As funções numéricas disponíveis variam consoante o número de colunas que selecionar. Pode optar por criar uma nova coluna com os resultados dos cálculos ou fazer com que os resultados apareçam na coluna onde adiciona a transformação.

Se aplicar uma função numérica a uma única coluna, o comportamento é diferente do que se aplicar uma função numérica a várias colunas. Por exemplo:

  • Se usar a função Multiply() numa única coluna, especifica o valor decimal pelo qual multiplicar cada valor na coluna. O Wrangler executa a multiplicação nos dados de amostra e apresenta os novos valores na mesma coluna ou numa nova coluna.
  • Se usar a função Multiply() em várias colunas, o Wrangler multiplica os valores em cada linha das colunas selecionadas e apresenta os novos valores na primeira coluna da transformação.

Fazer cálculos numéricos sobre valores numa coluna

Para aplicar um cálculo numérico a uma coluna, siga estes passos:

  1. Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. No separador Dados, aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
  3. Selecione Calcular e selecione uma opção, por exemplo, Adicionar.

    Para concluir o cálculo, algumas funções requerem que introduza um valor decimal. Por exemplo, se selecionar Subtrair, tem de introduzir o valor a subtrair de cada linha.

  4. Opcional: para criar uma nova coluna para os valores calculados, selecione a caixa de verificação Copiar para uma nova coluna.

  5. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como um passo na receita. Por exemplo, se subtrair dois a cada valor na coluna Price, o Wrangler adiciona a seguinte transformação à receita:

set-column :Price Price - 2

Quando executa o pipeline de dados, a transformação é aplicada a todos os valores na coluna.

Cálculos suportados para uma coluna

Pode fazer os seguintes cálculos em todos os valores de uma coluna:

Função Descrição
Valor absoluto Devolve o valor absoluto de cada valor numa coluna. Por exemplo, o valor absoluto de -10 é 10.
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Arccos Devolve o inverso do cosseno para cada valor numa coluna.
Arcsin Devolve o seno inverso de cada valor numa coluna.
Arctan Devolve a tangente inversa de cada valor numa coluna.
Ceil Devolve o menor número inteiro igual ou superior ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, a função CEIL devolve 3. Se o valor for 5,88, a função Teto devolve 6. Se o valor for -5,15, a função Teto devolve -5.
Cos Devolve o cosseno de cada valor da coluna.
Cube Eleva cada valor na coluna à potência de 3.
Raiz cúbica Devolve a raiz cúbica de cada valor na coluna.
Dividir Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas.
Floor Devolve o maior número inteiro igual ou superior ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, a função FLOOR devolve 2. Se o valor for 5,88, a função FLOOR devolve 5. Da mesma forma, se o valor for -5,15, a função FLOOR devolve -6.
Registo Devolve o logaritmo de cada valor numa coluna.
Modulo Devolve o resto da divisão de cada valor na coluna por um decimal positivo ou devolve o resto da divisão de cada valor em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.
Log natural Devolve o logaritmo natural de cada valor numa coluna.
Desligue Eleva o valor da coluna à potência especificada do valor.
Aleatório Gera valores duplos aleatórios e imprevisíveis numa coluna especificada.
Ronda Arredonda cada valor numa coluna.
Sin Devolve o seno de cada valor numa coluna.
Quadrado Eleva cada valor na coluna à potência de 2.
Raiz quadrada Devolve a raiz quadrada de cada valor numa coluna.
Subtrair Subtrai um decimal positivo ou negativo a cada valor na coluna.
Castanho-claro Devolve a tangente de cada valor numa coluna.

Realize cálculos numéricos sobre valores em duas colunas

Para aplicar um cálculo numérico a duas colunas, siga estes passos:

  1. Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. No separador Dados, selecione a caixa de verificação junto a dois nomes de colunas.
  3. Aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
  4. Selecione Calcular e selecione uma opção, por exemplo, Adicionar.
  5. Opcional: para criar uma nova coluna para os valores calculados, selecione a caixa de verificação Copiar para uma nova coluna. Caso contrário, os valores calculados substituem os valores existentes.
  6. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como um passo na receita. Por exemplo, se adicionar os valores em cada linha das colunas Q1_Sales e Q2_Sales e criar uma nova coluna denominada H1_Sales, o Wrangler adiciona a seguinte transformação à receita:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Quando executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna denominada H1_Sales com o total de Q1_Sales e Q2_Sales.

Cálculos suportados em duas colunas

Pode fazer os seguintes cálculos numéricos nos valores de cada linha em duas colunas:

Função Descrição
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Média Devolve a média de cada linha em várias colunas.
Dividir Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas.
Igual Função booleana que compara duas colunas para ver se os valores correspondem, linha a linha. Devolve true ou false.
LCM Devolve o menor múltiplo comum de cada número em duas colunas.
Máx. Devolve o valor máximo para cada linha em duas colunas.
Min Devolve o valor mínimo para cada linha em duas colunas.
Modulo Devolve o resto da divisão de cada valor na coluna por um decimal positivo ou devolve o resto da divisão de cada valor em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.
Subtrair Subtrai um decimal positivo ou negativo a cada valor na coluna.

Realizar cálculos numéricos em valores de três ou mais colunas

O Cloud Data Fusion suporta a realização de cálculos numéricos em valores de três ou mais colunas na versão 6.8.0 e posteriores.

Para aplicar um cálculo numérico a três ou mais colunas, siga estes passos:

  1. Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
  2. No separador Dados, selecione a caixa de verificação junto a dois nomes de colunas.
  3. Aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
  4. Selecione Calcular e selecione uma opção, por exemplo, Adicionar.
  5. Opcional: para criar uma nova coluna para os valores calculados, selecione a caixa de verificação Copiar para uma nova coluna. Caso contrário, os valores calculados substituem os valores existentes.
  6. Clique em Aplicar.

Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como um passo na receita. Por exemplo, se adicionar os valores em cada linha das colunas Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales e criar uma nova coluna denominada 2022_Sales, o Wrangler adiciona a seguinte transformação à receita:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Quando executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna denominada 2022_Sales com o total de Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales.

Cálculos suportados em três ou mais colunas

Pode fazer os seguintes cálculos nos valores de cada linha em três ou mais colunas:

Função Descrição
Adicionar Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha.
Média Devolve a média de cada linha em várias colunas.
Igual Função booleana que compara duas colunas para ver se os valores correspondem, linha a linha. Devolve true ou false.
Máx. Devolve o valor máximo para cada linha em duas colunas.
Min Devolve o valor mínimo para cada linha em duas colunas.
Multiplicar Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas.

O que se segue?