Esta página explica como realizar cálculos numéricos ao preparar dados em espaço de trabalho do Wrangler no Cloud Data Fusion Studio.
É possível realizar essas transformações em colunas dos seguintes tipos de dados:
- Número inteiro
- Decimal
- Duplo
- Ponto flutuante
- Longo
- Curta
Para mais informações, consulte a diretiva set-column
.
É possível usar funções numéricas em uma ou mais colunas. As funções numéricas disponíveis variam de acordo com o número de colunas selecionadas. Você pode optar por criar um uma nova coluna com os resultados dos cálculos, ou você pode ter os resultados aparecem na coluna em que você adiciona a transformação.
Se você aplicar uma função numérica a uma única coluna, o comportamento será diferente do que se aplicar uma função numérica a várias colunas. Exemplo:
- Se você usar a função
Multiply()
em uma única coluna, especifique o decimal pelo qual multiplicar cada valor na coluna. O Wrangler realiza multiplicação nos dados da amostra e exibe os novos valores no mesmo ou em uma nova coluna. - Se você usar a função
Multiply()
em várias colunas, o Wrangler multiplica os valores em cada linha para as colunas selecionadas e exibe os novos valores na primeira coluna da transformação.
Realizar cálculos numéricos em valores de uma coluna
Para aplicar um cálculo numérico a uma coluna, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, vá para o nome de uma coluna e clique no arrow_drop_down seta de expansão.
Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
Para concluir o cálculo, algumas funções exigem que você insira um valor decimal. Por exemplo, se você selecionar Subtrair, será necessário inserir o valor para subtrair de cada linha.
Opcional: para criar uma nova coluna para os valores calculados, selecione o Caixa de seleção Copiar para uma nova coluna.
Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você subtrair dois de cada
valor na coluna Price
, o Wrangler adiciona a seguinte transformação ao
receita:
set-column :Price Price - 2
Quando você executa o pipeline de dados, a transformação é aplicada a todos os valores em da coluna.
Cálculos com suporte para uma coluna
É possível realizar os seguintes cálculos em todos os valores de uma coluna:
Função | Descrição |
---|---|
Valor absoluto | Retorna o valor absoluto de cada valor em uma coluna. Por exemplo, o valor absoluto de -10 é 10. |
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Arccos | Retorna o inverso do cosseno de cada valor em uma coluna. |
Arcsin | Retorna o inverso do seno de cada valor em uma coluna. |
Arctan | Retorna o inverso da tangente para cada valor em uma coluna. |
Ceil | Retorna o menor número inteiro maior ou igual ao número em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o Ceil vai retornar 3. Se o valor for 5,88, o Ceil vai retornar 6. Se o valor é -5,15, e Ceil retorna -5. |
Cos (link em inglês) | Retorna o cosseno de cada valor de coluna. |
Cubo | Eleva cada valor na coluna à potência de 3. |
Raiz cúbica | Retorna a raiz cúbica de cada valor na coluna. |
Dividir | divide cada valor na coluna por um número decimal positivo ou negativo ou divide cada valor em duas colunas. |
Andar | Retorna o maior número inteiro maior ou igual ao valor numérico em cada célula de uma coluna. Por exemplo, se o valor for 2,21, o FLOOR vai retornar 2. Se o valor for 5,88, o FLOOR vai retornar 5. Da mesma forma, se o valor for -5,15, FLOOR retornará -6. |
Registro | Retorna o logaritmo de cada valor em uma coluna. |
Módulo | Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou o restante ao dividir cada valor em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
Registro natural | Retorna o logaritmo natural de cada valor em uma coluna. |
Potência de | Elevar o valor da coluna à potência especificada. |
Aleatório | Gera valores do tipo Double aleatórios e imprevisíveis em uma . |
Round | Arredonda cada valor em uma coluna. |
Pecado | Retorna o seno de cada valor em uma coluna. |
Quadrado | Elevar cada valor na coluna à potência 2. |
Raiz quadrada | Retorna a raiz quadrada de cada valor em uma coluna. |
Subtrair | Subtrai um decimal positivo ou negativo para cada valor na . |
Tan (link em inglês) | Retorna a tangente de cada valor em uma coluna. |
Fazer cálculos numéricos em valores de duas colunas
Para aplicar um cálculo numérico a duas colunas, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
- Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados vão valores existentes.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona o modelo
diretiva como uma etapa no roteiro. Por exemplo, se você adicionar os valores em cada linha
das colunas Q1_Sales
e Q2_Sales
e criar uma nova coluna chamada
H1_Sales
, o Wrangler adiciona a seguinte transformação ao roteiro:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria
uma nova coluna chamada H1_Sales
com o total de Q1_Sales
e Q2_Sales
.
Cálculos compatíveis em duas colunas
Você pode realizar os seguintes cálculos numéricos em valores de cada linha em duas colunas:
Função | Descrição |
---|---|
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Média | Retorna a média de cada linha em várias colunas. |
Dividir | divide cada valor na coluna por um número decimal positivo ou negativo ou divide cada valor em duas colunas. |
Igual | Função booleana que compara duas colunas para saber se os valores correspondem, linha
por linha. Retorna true ou false . |
LCM | Retorna o mínimo múltiplo comum de cada número em duas colunas. |
Máx. | Retorna o valor máximo de cada linha em duas colunas. |
Mín. | Retorna o valor mínimo de cada linha em duas colunas. |
Módulo | Retorna o restante ao dividir cada valor na coluna por um decimal positivo ou ao dividir cada valor em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
Subtrair | Subtrai um decimal positivo ou negativo de cada valor na coluna. |
Realizar cálculos numéricos em valores de três ou mais colunas
O Cloud Data Fusion oferece suporte à realização de cálculos numéricos em valores de três ou mais colunas na versão 6.8.0 e mais recentes.
Para aplicar um cálculo numérico a três ou mais colunas, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, marque a caixa de seleção ao lado de dois nomes de colunas.
- Acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Calcular e escolha uma opção, por exemplo, Adicionar.
- Opcional: para criar uma nova coluna para os valores calculados, marque a caixa de seleção Copiar para uma nova coluna. Caso contrário, os valores calculados vão valores existentes.
- Clique em Aplicar.
Os valores mudam com base no cálculo. O Wrangler adiciona a diretiva
correspondente como uma etapa na receita. Por exemplo, se você adicionar os valores em cada linha
das colunas Q1_Sales
, Q2_Sales
, Q3_Sales
e Q4_Sales
e criar uma
nova coluna chamada 2022_Sales
, o Wrangler vai adicionar a seguinte transformação à
receita:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Quando você executa o pipeline de dados, o Wrangler realiza a transformação e cria
uma nova coluna chamada 2022_Sales
com o total de Q1_Sales
, Q2_Sales
,
Q3_Sales
e Q4_Sales
.
Cálculos com suporte em três ou mais colunas
É possível realizar os cálculos a seguir nos valores de cada linha em três ou mais colunas:
Função | Descrição |
---|---|
Adicionar | Adiciona um decimal positivo ou negativo a uma coluna ou adiciona várias colunas para gerar a soma de cada linha. |
Na média | Retorna a média de cada linha em várias colunas. |
Igual | Função booleana que compara duas colunas para saber se os valores correspondem, linha
por linha. Retorna true ou false . |
Máx. | Retorna o valor máximo de cada linha em duas colunas. |
Mín. | Retorna o valor mínimo de cada linha em duas colunas. |
Multiplicar | Multiplica cada valor na coluna por um decimal positivo ou negativo ou multiplica cada valor em duas colunas. |
A seguir
- Saiba mais sobre as diretivas do Wrangler.