Cómo trabajar con números

Esta página explica cómo realizar cálculos numéricos cuando preparas datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.

Puedes realizar estas transformaciones en columnas de los siguientes tipos de datos:

  • Número entero
  • Decimal
  • Doble
  • Número de punto flotante
  • Largo
  • Brevedad normal

Para obtener más información, consulta la directiva set-column.

Puedes usar funciones numéricas en una o más columnas. Son los valores numéricos varían según la cantidad de columnas que selecciones. Puedes optar por crear nueva columna con los resultados de los cálculos, o puedes tener los resultados en la columna en la que agregas la transformación.

Si aplicas una regla función a una sola columna, el comportamiento es diferente que si aplicas una función numérica a varias columnas. Por ejemplo:

  • Si usas la función Multiply() en una sola columna, debes especificar valor decimal para multiplicar cada valor en la columna. Wrangler realiza multiplicaciones en los datos de la muestra y muestra los valores nuevos de la misma columna o en una nueva columna.
  • Si usas la función Multiply() en varias columnas, Wrangler умножает los valores de cada fila de las columnas seleccionadas y muestra los valores nuevos en la primera columna de la transformación.

Realizar cálculos numéricos sobre los valores de una columna

Para aplicar un cálculo numérico a una columna, sigue estos pasos:

  1. Ve al lugar de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
  3. Selecciona Calcular y elige una opción, por ejemplo, Sumar.

    Para completar el cálculo, algunas funciones requieren que ingreses un decimal valor. Por ejemplo, si seleccionas Restar, debes ingresar el valor que se resta de cada fila.

  4. Opcional: Para crear una columna nueva para los valores calculados, selecciona el Casilla de verificación Copy to a new column.

  5. Haz clic en Aplicar.

Los valores cambian según el cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si restas dos a cada uno en la columna Price, Wrangler agrega la siguiente transformación al receta:

set-column :Price Price - 2

Cuando ejecutas la canalización de datos, la transformación se aplica a todos los valores en la columna.

Cálculos admitidos para una columna

Puedes realizar los siguientes cálculos en todos los valores de una columna:

Función Descripción
Valor absoluto Muestra el valor absoluto de cada valor en una columna. Por ejemplo, el valor absoluto de -10 es 10.
Agregar Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila.
Arccos Muestra el coseno inverso de cada valor de una columna.
Arcsinus Muestra el inverso de pecado para cada valor de una columna.
Arctan Muestra el inverso de la tangente para cada valor de una columna.
Ceil Devuelve el número entero más bajo que sea superior o igual al valor numérico. valor en cada celda de una columna. Por ejemplo, si el valor es 2.21, Ceil muestra 3. Si el valor es 5.88, Ceil muestra 6. Si el valor es -5.15, Ceil devuelve -5.
Cos Muestra el coseno de cada valor de columna.
Cube Eleva cada valor de la columna a la potencia de 3.
Raíz cúbica Muestra la raíz cúbica de cada valor de la columna.
Dividir Si divides cada valor en la columna por un decimal positivo o negativo, o divide cada valor en dos columnas.
Piso Muestra el número entero más alto que sea mayor o igual al valor numérico en cada celda de una columna. Por ejemplo, si el valor es 2.21, MULTIPLO.INFERIOR devuelve 2. Si el valor es 5.88, PISO muestra 5. Del mismo modo, si el valor es -5.15, PISO muestra -6.
Registro Muestra el logaritmo de cada valor en una columna.
Modulo Muestra el resto cuando se divide cada valor de la columna por un decimal positivo o muestra el resto cuando se divide cada valor de dos columnas.
Multiplicar Multiplica cada valor de la columna por un decimal positivo o negativo, o bien multiplica cada valor en dos columnas.
Registro natural Muestra el logaritmo natural de cada valor en una columna.
Poder de Eleva el valor de la columna a la potencia especificada.
Aleatorio Genera valores dobles impredecibles y aleatorios en un rango .
Redonda Redondea cada valor de una columna.
Pequeño Muestra el seno de cada valor de una columna.
Cuadrada Eleva cada valor de la columna a la potencia de 2.
Raíz cuadrada Muestra la raíz cuadrada de cada valor de una columna.
Sustraer Resta un decimal positivo o negativo a cada valor de la columna.
Marrón Muestra la tangente de cada valor en una columna.

Realizar cálculos numéricos en valores de dos columnas

Para aplicar un cálculo numérico a dos columnas, sigue estos pasos:

  1. Ve al lugar de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, selecciona la casilla de verificación junto a dos nombres de columna.
  3. Ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
  4. Selecciona Calculate y, luego, una opción, por ejemplo, Add.
  5. Opcional: Para crear una columna nueva para los valores calculados, selecciona el Casilla de verificación Copy to a new column. De lo contrario, los valores calculados anula los valores existentes.
  6. Haz clic en Aplicar.

Los valores cambian en función del cálculo. Wrangler agrega el conjunto de directiva como paso en la receta. Por ejemplo, si sumas los valores en cada fila de las columnas Q1_Sales y Q2_Sales, y crea una nueva llamada H1_Sales, Wrangler agrega la siguiente transformación a la receta:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una columna nueva llamada H1_Sales con el total de Q1_Sales y Q2_Sales.

Cálculos admitidos en dos columnas

Puedes realizar los siguientes cálculos numéricos sobre los valores de cada fila en dos columnas:

Función Descripción
Agregar Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila.
Promedio Devuelve el promedio de cada fila en varias columnas.
Dividir Si divides cada valor en la columna por un decimal positivo o negativo, o divide cada valor en dos columnas.
Igual Función booleana que compara dos columnas para ver si los valores coinciden, fila por fila. Muestra true o false.
LCM Muestra el mínimo común múltiplo de cada número en dos columnas.
Max Muestra el valor máximo de cada fila en dos columnas.
Min Devuelve el valor mínimo de cada fila en dos columnas.
Módulo Devuelve el resto cuando divides cada valor de la columna por un decimal positivo o devuelve el resto cuando se divide cada valor en dos columnas.
Multiplicar Multiplica cada valor de la columna por un decimal positivo o negativo, o bien умножает cada valor en dos columnas.
Restar Resta un decimal positivo o negativo a cada valor de la columna.

Realizar cálculos numéricos en valores de tres o más columnas

Cloud Data Fusion admite la realización de cálculos numéricos sobre valores en tres o más columnas en la versión 6.8.0 y posteriores.

Para aplicar un cálculo numérico a tres o más columnas, sigue estos pasos:

  1. Ve al lugar de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, selecciona la casilla de verificación junto a dos nombres de columna.
  3. Ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
  4. Selecciona Calculate y, luego, una opción, por ejemplo, Add.
  5. Opcional: Para crear una columna nueva para los valores calculados, selecciona el Casilla de verificación Copy to a new column. De lo contrario, los valores calculados anula los valores existentes.
  6. Haz clic en Aplicar.

Los valores cambian en función del cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si agregas los valores de cada fila de las columnas Q1_Sales, Q2_Sales, Q3_Sales y Q4_Sales y creas una columna nueva llamada 2022_Sales, Wrangler agrega la siguiente transformación a la receta:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una columna nueva llamada 2022_Sales con el total de Q1_Sales, Q2_Sales, Q3_Sales y Q4_Sales.

Cálculos admitidos en tres o más columnas

Puedes realizar los siguientes cálculos sobre los valores de cada fila en tres o columnas adicionales:

Función Descripción
Agregar Agrega un decimal positivo o negativo a una columna o varias columnas para obtener la suma de cada fila.
Promedio Muestra el promedio de cada fila en varias columnas.
Igual Es una función booleana que compara dos columnas para ver si los valores coinciden, fila por fila. Muestra true o false.
Máx. Muestra el valor máximo de cada fila en dos columnas.
min Muestra el valor mínimo de cada fila en dos columnas.
Multiplicar Multiplica cada valor de la columna por un decimal positivo o negativo, o multiplica cada valor en dos columnas.

¿Qué sigue?