Esta página explica como fazer cálculos numéricos quando prepara dados no espaço de trabalho do Wrangler do Cloud Data Fusion Studio.
Pode fazer estas transformações em colunas dos seguintes tipos de dados:
- Número inteiro
- Decimal
- Duplo
- Flutuante
- Longo
- Curto
Para mais informações, consulte a diretiva set-column
.
Pode usar funções numéricas numa ou mais colunas. As funções numéricas disponíveis variam consoante o número de colunas que selecionar. Pode optar por criar uma nova coluna com os resultados dos cálculos ou fazer com que os resultados apareçam na coluna onde adiciona a transformação.
Se aplicar uma função numérica a uma única coluna, o comportamento é diferente do que se aplicar uma função numérica a várias colunas. Por exemplo:
- Se usar a função
Multiply()
numa única coluna, especifica o valor decimal pelo qual multiplicar cada valor na coluna. O Wrangler executa a multiplicação nos dados de amostra e apresenta os novos valores na mesma coluna ou numa nova coluna. - Se usar a função
Multiply()
em várias colunas, o Wrangler multiplica os valores em cada linha das colunas selecionadas e apresenta os novos valores na primeira coluna da transformação.
Fazer cálculos numéricos sobre valores numa coluna
Para aplicar um cálculo numérico a uma coluna, siga estes passos:
- Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
- No separador Dados, aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
Selecione Calcular e selecione uma opção, por exemplo, Adicionar.
Para concluir o cálculo, algumas funções requerem que introduza um valor decimal. Por exemplo, se selecionar Subtrair, tem de introduzir o valor a subtrair de cada linha.
Opcional: para criar uma nova coluna para os valores calculados, selecione a caixa de verificação Copiar para uma nova coluna.
Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como um passo na receita. Por exemplo, se subtrair dois a cada valor na coluna Price
, o Wrangler adiciona a seguinte transformação à receita:
set-column :Price Price - 2
Quando executa o pipeline de dados, a transformação é aplicada a todos os valores na coluna.
Cálculos suportados para uma coluna
Pode fazer os seguintes cálculos em todos os valores de uma coluna:
Função | Descrição |
---|---|
Valor absoluto | Devolve o valor absoluto de cada valor numa coluna. Por exemplo, o valor absoluto de -10 é 10. |
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Arccos | Devolve o inverso do cosseno para cada valor numa coluna. |
Arcsin | Devolve o seno inverso de cada valor numa coluna. |
Arctan | Devolve a tangente inversa de cada valor numa coluna. |
Ceil | Devolve o menor número inteiro igual ou superior ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, a função CEIL devolve 3. Se o valor for 5,88, a função Teto devolve 6. Se o valor for -5,15, a função Teto devolve -5. |
Cos | Devolve o cosseno de cada valor da coluna. |
Cube | Eleva cada valor na coluna à potência de 3. |
Raiz cúbica | Devolve a raiz cúbica de cada valor na coluna. |
Dividir | Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas. |
Floor | Devolve o maior número inteiro igual ou superior ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, a função FLOOR devolve 2. Se o valor for 5,88, a função FLOOR devolve 5. Da mesma forma, se o valor for -5,15, a função FLOOR devolve -6. |
Registo | Devolve o logaritmo de cada valor numa coluna. |
Modulo | Devolve o resto da divisão de cada valor na coluna por um decimal positivo ou devolve o resto da divisão de cada valor em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
Log natural | Devolve o logaritmo natural de cada valor numa coluna. |
Desligue | Eleva o valor da coluna à potência especificada do valor. |
Aleatório | Gera valores duplos aleatórios e imprevisíveis numa coluna especificada. |
Ronda | Arredonda cada valor numa coluna. |
Sin | Devolve o seno de cada valor numa coluna. |
Quadrado | Eleva cada valor na coluna à potência de 2. |
Raiz quadrada | Devolve a raiz quadrada de cada valor numa coluna. |
Subtrair | Subtrai um decimal positivo ou negativo a cada valor na coluna. |
Castanho-claro | Devolve a tangente de cada valor numa coluna. |
Realize cálculos numéricos sobre valores em duas colunas
Para aplicar um cálculo numérico a duas colunas, siga estes passos:
- Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
- No separador Dados, selecione a caixa de verificação junto a dois nomes de colunas.
- Aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e selecione uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, selecione a caixa de verificação Copiar para uma nova coluna. Caso contrário, os valores calculados substituem os valores existentes.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como um passo na receita. Por exemplo, se adicionar os valores em cada linha das colunas Q1_Sales
e Q2_Sales
e criar uma nova coluna denominada H1_Sales
, o Wrangler adiciona a seguinte transformação à receita:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Quando executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna denominada H1_Sales
com o total de Q1_Sales
e Q2_Sales
.
Cálculos suportados em duas colunas
Pode fazer os seguintes cálculos numéricos nos valores de cada linha em duas colunas:
Função | Descrição |
---|---|
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Média | Devolve a média de cada linha em várias colunas. |
Dividir | Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas. |
Igual | Função booleana que compara duas colunas para ver se os valores correspondem, linha a linha. Devolve true ou false . |
LCM | Devolve o menor múltiplo comum de cada número em duas colunas. |
Máx. | Devolve o valor máximo para cada linha em duas colunas. |
Min | Devolve o valor mínimo para cada linha em duas colunas. |
Modulo | Devolve o resto da divisão de cada valor na coluna por um decimal positivo ou devolve o resto da divisão de cada valor em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
Subtrair | Subtrai um decimal positivo ou negativo a cada valor na coluna. |
Realizar cálculos numéricos em valores de três ou mais colunas
O Cloud Data Fusion suporta a realização de cálculos numéricos em valores de três ou mais colunas na versão 6.8.0 e posteriores.
Para aplicar um cálculo numérico a três ou mais colunas, siga estes passos:
- Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
- No separador Dados, selecione a caixa de verificação junto a dois nomes de colunas.
- Aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e selecione uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, selecione a caixa de verificação Copiar para uma nova coluna. Caso contrário, os valores calculados substituem os valores existentes.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva correspondente como um passo na receita. Por exemplo, se adicionar os valores em cada linha das colunas Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
e criar uma nova coluna denominada 2022_Sales
, o Wrangler adiciona a seguinte transformação à receita:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Quando executa o pipeline de dados, o Wrangler realiza a transformação e cria uma nova coluna denominada 2022_Sales
com o total de Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
.
Cálculos suportados em três ou mais colunas
Pode fazer os seguintes cálculos nos valores de cada linha em três ou mais colunas:
Função | Descrição |
---|---|
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Média | Devolve a média de cada linha em várias colunas. |
Igual | Função booleana que compara duas colunas para ver se os valores correspondem, linha a linha. Devolve true ou false . |
Máx. | Devolve o valor máximo para cada linha em duas colunas. |
Min | Devolve o valor mínimo para cada linha em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
O que se segue?
- Saiba mais acerca das diretivas do Wrangler.