Nesta página, explicamos como realizar cálculos numéricos ao preparar dados no espaço de trabalho do Wrangler no Cloud Data Fusion Studio.
É possível realizar essas transformações em colunas dos seguintes tipos de dados:
- Número inteiro
- Decimal
- Duplo
- Ponto flutuante
- Longo
- Curta
Para mais informações, consulte a diretiva set-column.
É possível usar funções numéricas em uma ou mais colunas. As funções numéricas disponíveis variam de acordo com o número de colunas selecionadas. Você pode criar uma nova coluna com os resultados dos cálculos ou fazer com que os resultados apareçam na coluna em que você adiciona a transformação.
Se você aplicar uma função numérica a uma única coluna, o comportamento será diferente do que se aplicar uma função numérica a várias colunas. Exemplo:
- Se você usar a função
Multiply()em uma única coluna, especifique o valor decimal para multiplicar cada valor na coluna. O Wrangler realiza a multiplicação nos dados de amostra e exibe os novos valores na mesma coluna ou em uma nova coluna. - Se você usar a função
Multiply()em várias colunas, o Wrangler vai multiplicar os valores em cada linha das colunas selecionadas e mostrar os novos valores na primeira coluna da transformação.
Fazer cálculos numéricos em valores de uma coluna
Para aplicar um cálculo numérico a uma coluna, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
Para concluir o cálculo, algumas funções exigem que você insira um valor decimal. Por exemplo, se você selecionar Subtrair, insira o valor a ser subtraído de cada linha.
Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna.
Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você subtrair dois de cada valor na coluna Price, o Wrangler vai adicionar a seguinte transformação à receita:
set-column :Price Price - 2
Quando você executa o pipeline de dados, a transformação é aplicada a todos os valores na coluna.
Cálculos com suporte para uma coluna
É possível realizar os seguintes cálculos em todos os valores de uma coluna:
| Função | Descrição |
|---|---|
| Valor absoluto | Retorna o valor absoluto de cada valor em uma coluna. Por exemplo, o valor absoluto de -10 é 10. |
| Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
| Arccos | Retorna o inverso do cosseno de cada valor em uma coluna. |
| Arcsin | Retorna o inverso de seno para cada valor em uma coluna. |
| Arctan | Retorna o inverso da tangente para cada valor em uma coluna. |
| Ceil | Retorna o menor número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o Ceil vai retornar 3. Se o valor for 5,88, o Ceil vai retornar 6. Se o valor for -5,15, o Ceil vai retornar -5. |
| Cos | Retorna o cosseno de cada valor de coluna. |
| Cubo | Elevar cada valor na coluna à potência 3. |
| Raiz cúbica | Retorna a raiz cúbica de cada valor na coluna. |
| Dividir | Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas. |
| Andar | Retorna o maior número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o FLOOR vai retornar 2. Se o valor for 5,88, o FLOOR vai retornar 5. Da mesma forma, se o valor for -5,15, o FLOOR vai retornar -6. |
| Registro | Retorna o logaritmo de cada valor em uma coluna. |
| Módulo | Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas. |
| Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
| Registro natural | Retorna o logaritmo natural de cada valor em uma coluna. |
| Potência de | Elevar o valor da coluna à potência especificada. |
| Aleatório | Gera valores de Double aleatórios e imprevisíveis em uma coluna especificada. |
| Round | Arredonda cada valor em uma coluna. |
| Pecado | Retorna o seno de cada valor em uma coluna. |
| Square | Elevar cada valor na coluna à potência 2. |
| Raiz quadrada | Retorna a raiz quadrada de cada valor em uma coluna. |
| Subtrair | Subtrai um decimal positivo ou negativo de cada valor na coluna. |
| Tan | Retorna a tangente de cada valor em uma coluna. |
Fazer cálculos numéricos em valores de duas colunas
Para aplicar um cálculo numérico a duas colunas, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
- Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados substituirão os valores atuais.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha
das colunas Q1_Sales e Q2_Sales e criar uma nova coluna chamada
H1_Sales, o Wrangler vai adicionar a seguinte transformação à receita:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria
uma nova coluna chamada H1_Sales com o total de Q1_Sales e Q2_Sales.
Cálculos com suporte em duas colunas
É possível realizar os seguintes cálculos numéricos nos valores de cada linha em duas colunas:
| Função | Descrição |
|---|---|
| Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
| Média | Retorna a média de cada linha em várias colunas. |
| Dividir | Divide cada valor na coluna por um decimal positivo ou negativo ou divide cada valor em duas colunas. |
| Igual | Função booleana que compara duas colunas para saber se os valores correspondem, linha
por linha. Retorna true ou false. |
| LCM | Retorna o mínimo múltiplo comum de cada número em duas colunas. |
| Max | Retorna o valor máximo de cada linha em duas colunas. |
| Mín. | Retorna o valor mínimo de cada linha em duas colunas. |
| Módulo | Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas. |
| Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
| Subtrair | Subtrai um decimal positivo ou negativo de cada valor na coluna. |
Realizar cálculos numéricos em valores de três ou mais colunas
O Cloud Data Fusion oferece suporte à realização de cálculos numéricos em valores em três ou mais colunas na versão 6.8.0 e mais recentes.
Para aplicar um cálculo numérico a três ou mais colunas, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
- Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados substituirão os valores atuais.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha
das colunas Q1_Sales, Q2_Sales, Q3_Sales e Q4_Sales e criar uma
nova coluna chamada 2022_Sales, o Wrangler vai adicionar a seguinte transformação à
receita:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria
uma nova coluna chamada 2022_Sales com o total de Q1_Sales, Q2_Sales,
Q3_Sales e Q4_Sales.
Cálculos com suporte em três ou mais colunas
É possível realizar os cálculos a seguir nos valores de cada linha em três ou mais colunas:
| Função | Descrição |
|---|---|
| Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
| Média | Retorna a média de cada linha em várias colunas. |
| Igual | Função booleana que compara duas colunas para saber se os valores correspondem, linha
por linha. Retorna true ou false. |
| Max | Retorna o valor máximo de cada linha em duas colunas. |
| Mín. | Retorna o valor mínimo de cada linha em duas colunas. |
| Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
A seguir
- Saiba mais sobre as diretivas do Wrangler.