Nesta página, explicamos como realizar cálculos numéricos ao preparar dados no espaço de trabalho do Wrangler no Cloud Data Fusion Studio.
É possível realizar essas transformações em colunas dos seguintes tipos de dados:
- Número inteiro
- Decimal
- Duplo
- Ponto flutuante
- Longo
- Curta
Para mais informações, consulte a diretiva set-column
.
É possível usar funções numéricas em uma ou mais colunas. As funções numéricas disponíveis variam de acordo com o número de colunas selecionadas. Você pode criar uma nova coluna com os resultados dos cálculos ou fazer com que os resultados apareçam na coluna em que você adiciona a transformação.
Se você aplicar uma função numérica a uma única coluna, o comportamento será diferente do que se aplicar uma função numérica a várias colunas. Exemplo:
- Se você usar a função
Multiply()
em uma única coluna, especifique o valor decimal para multiplicar cada valor na coluna. O Wrangler realiza a multiplicação nos dados de amostra e exibe os novos valores na mesma coluna ou em uma nova coluna. - Se você usar a função
Multiply()
em várias colunas, o Wrangler vai multiplicar os valores em cada linha das colunas selecionadas e mostrar os novos valores na primeira coluna da transformação.
Fazer cálculos numéricos em valores de uma coluna
Para aplicar um cálculo numérico a uma coluna, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
Para concluir o cálculo, algumas funções exigem que você insira um valor decimal. Por exemplo, se você selecionar Subtrair, insira o valor a ser subtraído de cada linha.
Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna.
Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você subtrair dois de cada valor na coluna Price
, o Wrangler vai adicionar a seguinte transformação à receita:
set-column :Price Price - 2
Quando você executa o pipeline de dados, a transformação é aplicada a todos os valores na coluna.
Cálculos com suporte para uma coluna
É possível realizar os seguintes cálculos em todos os valores de uma coluna:
Função | Descrição |
---|---|
Valor absoluto | Retorna o valor absoluto de cada valor em uma coluna. Por exemplo, o valor absoluto de -10 é 10. |
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Arccos | Retorna o inverso do cosseno de cada valor em uma coluna. |
Arcsin | Retorna o inverso de seno para cada valor em uma coluna. |
Arctan | Retorna o inverso da tangente para cada valor em uma coluna. |
Ceil | Retorna o menor número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o Ceil vai retornar 3. Se o valor for 5,88, o Ceil vai retornar 6. Se o valor for -5,15, o Ceil vai retornar -5. |
Cos | Retorna o cosseno de cada valor de coluna. |
Cubo | Elevar cada valor na coluna à potência 3. |
Raiz cúbica | Retorna a raiz cúbica de cada valor na coluna. |
Dividir | Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas. |
Andar | Retorna o maior número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o FLOOR vai retornar 2. Se o valor for 5,88, o FLOOR vai retornar 5. Da mesma forma, se o valor for -5,15, o FLOOR vai retornar -6. |
Registro | Retorna o logaritmo de cada valor em uma coluna. |
Módulo | Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
Registro natural | Retorna o logaritmo natural de cada valor em uma coluna. |
Potência de | Elevar o valor da coluna à potência especificada. |
Aleatório | Gera valores de Double aleatórios e imprevisíveis em uma coluna especificada. |
Round | Arredonda cada valor em uma coluna. |
Pecado | Retorna o seno de cada valor em uma coluna. |
Square | Elevar cada valor na coluna à potência 2. |
Raiz quadrada | Retorna a raiz quadrada de cada valor em uma coluna. |
Subtrair | Subtrai um decimal positivo ou negativo de cada valor na coluna. |
Tan | Retorna a tangente de cada valor em uma coluna. |
Fazer cálculos numéricos em valores de duas colunas
Para aplicar um cálculo numérico a duas colunas, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
- Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados substituirão os valores atuais.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha
das colunas Q1_Sales
e Q2_Sales
e criar uma nova coluna chamada
H1_Sales
, o Wrangler vai adicionar a seguinte transformação à receita:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria
uma nova coluna chamada H1_Sales
com o total de Q1_Sales
e Q2_Sales
.
Cálculos com suporte em duas colunas
É possível realizar os seguintes cálculos numéricos nos valores de cada linha em duas colunas:
Função | Descrição |
---|---|
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Média | Retorna a média de cada linha em várias colunas. |
Dividir | Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas. |
Igual | Função booleana que compara duas colunas para saber se os valores correspondem, linha
por linha. Retorna true ou false . |
LCM | Retorna o mínimo múltiplo comum de cada número em duas colunas. |
Max | Retorna o valor máximo de cada linha em duas colunas. |
Mín. | Retorna o valor mínimo de cada linha em duas colunas. |
Módulo | Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
Subtrair | Subtrai um decimal positivo ou negativo de cada valor na coluna. |
Realizar cálculos numéricos em valores de três ou mais colunas
O Cloud Data Fusion oferece suporte à realização de cálculos numéricos em valores em três ou mais colunas na versão 6.8.0 e mais recentes.
Para aplicar um cálculo numérico a três ou mais colunas, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
- Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados substituirão os valores atuais.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha
das colunas Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
e criar uma
nova coluna chamada 2022_Sales
, o Wrangler vai adicionar a seguinte transformação à
receita:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria
uma nova coluna chamada 2022_Sales
com o total de Q1_Sales
, Q2_Sales
,
Q3_Sales
e Q4_Sales
.
Cálculos com suporte em três ou mais colunas
É possível realizar os cálculos a seguir nos valores de cada linha em três ou mais colunas:
Função | Descrição |
---|---|
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Média | Retorna a média de cada linha em várias colunas. |
Igual | Função booleana que compara duas colunas para saber se os valores correspondem, linha
por linha. Retorna true ou false . |
Max | Retorna o valor máximo de cada linha em duas colunas. |
Mín. | Retorna o valor mínimo de cada linha em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
A seguir
- Saiba mais sobre as diretivas do Wrangler.