Trabajar con números

En esta página se explica cómo realizar cálculos numéricos al preparar datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.

Puede realizar estas transformaciones en columnas de los siguientes tipos de datos:

  • Entero
  • Decimal
  • Doble
  • Flotante
  • Long
  • Poca

Para obtener más información, consulta la directiva set-column.

Puedes usar funciones numéricas en una o varias columnas. Las funciones numéricas disponibles varían en función del número de columnas que selecciones. Puedes crear una columna con los resultados de los cálculos o hacer que aparezcan en la columna en la que añadas la transformación.

Si aplica una función numérica a una sola columna, el comportamiento es diferente que si aplica una función numérica a varias columnas. Por ejemplo:

  • Si usa la función Multiply() en una sola columna, especifique el valor decimal por el que se multiplicará cada valor de la columna. Wrangler multiplica los datos de muestra y muestra los nuevos valores en la misma columna o en una nueva.
  • Si usas la función Multiply() en varias columnas, Wrangler multiplica los valores de cada fila de las columnas seleccionadas y muestra los nuevos valores en la primera columna de la transformación.

Hacer cálculos numéricos con los valores de una columna

Para aplicar un cálculo numérico a una columna, sigue estos pasos:

  1. Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, vaya al nombre de una columna y haga clic en la flecha de expansión arrow_drop_down.
  3. Selecciona Calcular y elige una opción (por ejemplo, Sumar).

    Para completar el cálculo, algunas funciones requieren que introduzcas un valor decimal. Por ejemplo, si selecciona Restar, debe introducir el valor que se restará de cada fila.

  4. Opcional: Para crear una columna con los valores calculados, selecciona la casilla Copiar en una columna nueva.

  5. Haz clic en Aplicar.

Los valores cambian en función del cálculo. Wrangler añade la directiva correspondiente como paso en la receta. Por ejemplo, si restas dos a cada valor de la columna Price, Wrangler añade la siguiente transformación a la receta:

set-column :Price Price - 2

Cuando ejecute la canalización de datos, la transformación se aplicará a todos los valores de la columna.

Cálculos admitidos para una columna

Puedes realizar los siguientes cálculos con todos los valores de una columna:

Función Descripción
Valor absoluto Devuelve el valor absoluto de cada valor de una columna. Por ejemplo, el valor absoluto de -10 es 10.
Añadir Añade un decimal positivo o negativo a una columna o añade varias columnas para mostrar la suma de cada fila.
Arccos Devuelve el coseno inverso de cada valor de una columna.
Arcsin Devuelve el seno inverso de cada valor de una columna.
Arctan Devuelve la tangente inversa de cada valor de una columna.
Ceil Devuelve el menor número entero que sea superior o igual al valor numérico de cada celda de una columna. Por ejemplo, si el valor es 2,21, Ceil devuelve 3. Si el valor es 5,88, Ceil devuelve 6. Si el valor es -5,15, Ceil devuelve -5.
Cos Devuelve el coseno de cada valor de columna.
Cube Eleva al cubo cada valor de la columna.
Raíz cúbica Devuelve la raíz cúbica de cada valor de la columna.
Dividir Divide cada valor de la columna entre un decimal positivo o negativo, o bien divide cada valor de dos columnas.
Suelo Devuelve el número entero más grande que sea mayor o igual que el valor numérico de cada celda de una columna. Por ejemplo, si el valor es 2,21, FLOOR devuelve 2. Si el valor es 5,88, FLOOR devuelve 5. Del mismo modo, si el valor es -5,15, FLOOR devuelve -6.
Registro Devuelve el logaritmo de cada valor de una columna.
Modulo Devuelve el resto de dividir cada valor de la columna entre un decimal positivo o el resto de dividir cada valor de dos columnas.
Multiplicar Multiplica cada valor de la columna por un decimal positivo o negativo, o multiplica cada valor de dos columnas.
Logaritmo natural Devuelve el logaritmo natural de cada valor de una columna.
Poder de Eleva el valor de la columna a la potencia especificada del valor.
Aleatorio Genera valores Double aleatorios e impredecibles en una columna especificada.
Redondo Redondea cada valor de una columna.
Sin Devuelve el seno de cada valor de una columna.
Cuadrado Eleva al cuadrado cada valor de la columna.
Raíz cuadrada Devuelve la raíz cuadrada de cada valor de una columna.
Substract Resta un decimal positivo o negativo a cada valor de la columna.
Bronceado Devuelve la tangente de cada valor de una columna.

Realizar cálculos numéricos con los valores de dos columnas

Para aplicar un cálculo numérico a dos columnas, sigue estos pasos:

  1. Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, marque la casilla situada junto a los nombres de dos columnas.
  3. Ve al nombre de una columna y haz clic en la flecha de expansión arrow_drop_down.
  4. Selecciona Calcular y elige una opción (por ejemplo, Sumar).
  5. Opcional: Para crear una columna con los valores calculados, selecciona la casilla Copiar en una columna nueva. De lo contrario, los valores calculados sobrescribirán los valores existentes.
  6. Haz clic en Aplicar.

Los valores cambian en función del cálculo. Wrangler añade la directiva correspondiente como paso en la receta. Por ejemplo, si añade los valores de cada fila de las columnas Q1_Sales y Q2_Sales y crea una columna llamada H1_Sales, Wrangler añade la siguiente transformación a la receta:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una columna llamada H1_Sales con el total de Q1_Sales y Q2_Sales.

Cálculos admitidos en dos columnas

Puede realizar los siguientes cálculos numéricos con los valores de cada fila de dos columnas:

Función Descripción
Añadir Añade un decimal positivo o negativo a una columna o añade varias columnas para obtener la suma de cada fila.
Media Devuelve el promedio de cada fila de varias columnas.
Dividir Divide cada valor de la columna entre un decimal positivo o negativo, o bien divide cada valor de dos columnas.
Igual Función booleana que compara dos columnas para ver si los valores coinciden fila por fila. Devuelve true o false.
LCM Devuelve el mínimo común múltiplo de cada número de dos columnas.
Máximo Devuelve el valor máximo de cada fila de dos columnas.
Mín. Devuelve el valor mínimo de cada fila de dos columnas.
Modulo Devuelve el resto de dividir cada valor de la columna entre un decimal positivo o el resto de dividir cada valor de dos columnas.
Multiplicar Multiplica cada valor de la columna por un decimal positivo o negativo, o bien multiplica cada valor de dos columnas.
Restar Resta un decimal positivo o negativo a cada valor de la columna.

Realizar cálculos numéricos con los valores de tres o más columnas

Cloud Data Fusion permite realizar cálculos numéricos con los valores de tres o más columnas en la versión 6.8.0 y posteriores.

Para aplicar un cálculo numérico a tres o más columnas, sigue estos pasos:

  1. Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, marque la casilla situada junto a los nombres de dos columnas.
  3. Ve al nombre de una columna y haz clic en la flecha de expansión arrow_drop_down.
  4. Selecciona Calcular y elige una opción (por ejemplo, Sumar).
  5. Opcional: Para crear una columna con los valores calculados, selecciona la casilla Copiar en una columna nueva. De lo contrario, los valores calculados sobrescribirán los valores existentes.
  6. Haz clic en Aplicar.

Los valores cambian en función del cálculo. Wrangler añade la directiva correspondiente como paso en la receta. Por ejemplo, si añade los valores de cada fila de las columnas Q1_Sales, Q2_Sales, Q3_Sales y Q4_Sales y crea una columna llamada 2022_Sales, Wrangler añade la siguiente transformación a la receta:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Cuando ejecutas el flujo de datos, Wrangler realiza la transformación y crea una columna llamada 2022_Sales con el total de Q1_Sales, Q2_Sales, Q3_Sales y Q4_Sales.

Cálculos admitidos en tres o más columnas

Puede realizar los siguientes cálculos con los valores de cada fila en tres o más columnas:

Función Descripción
Añadir Añade un decimal positivo o negativo a una columna o añade varias columnas para obtener la suma de cada fila.
Media Devuelve el promedio de cada fila de varias columnas.
Igual Función booleana que compara dos columnas para ver si los valores coinciden fila por fila. Devuelve true o false.
Máximo Devuelve el valor máximo de cada fila de dos columnas.
Mín. Devuelve el valor mínimo de cada fila de dos columnas.
Multiplicar Multiplica cada valor de la columna por un decimal positivo o negativo, o bien multiplica cada valor de dos columnas.

Siguientes pasos