En esta página, se explica cómo realizar cálculos numéricos cuando preparas datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.
Puedes realizar estas transformaciones en columnas de los siguientes tipos de datos:
- Número entero
- Decimal
- Doble
- Número de punto flotante
- Largo
- Corto
Para obtener más información, consulta la directiva set-column
.
Puedes usar funciones numéricas en una o más columnas. Las funciones numéricas disponibles varían según la cantidad de columnas que selecciones. Puedes crear una columna nueva con los resultados de los cálculos o hacer que los resultados aparezcan en la columna en la que agregas la transformación.
Si aplicas una función numérica a una sola columna, el comportamiento es diferente al de aplicar una función numérica a varias columnas. Por ejemplo:
- Si usas la función
Multiply()
en una sola columna, debes especificar el valor decimal por el que se multiplicará cada valor de la columna. Wrangler realiza la multiplicación en los datos de muestra y muestra los valores nuevos en la misma columna o en una nueva. - Si usas la función
Multiply()
en varias columnas, Wrangler умножает los valores de cada fila de las columnas seleccionadas y muestra los valores nuevos en la primera columna de la transformación.
Cómo realizar cálculos numéricos en valores de una columna
Para aplicar un cálculo numérico a una columna, sigue estos pasos:
- Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
Selecciona Calcular y elige una opción, por ejemplo, Sumar.
Para completar el cálculo, algunas funciones requieren que ingreses un valor decimal. Por ejemplo, si seleccionas Restar, debes ingresar el valor que se resta de cada fila.
Opcional: Para crear una columna nueva para los valores calculados, selecciona la casilla de verificación Copiar en una columna nueva.
Haz clic en Aplicar.
Los valores cambian según el cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si restas dos de cada valor de la columna Price
, Wrangler agrega la siguiente transformación a la receta:
set-column :Price Price - 2
Cuando ejecutas la canalización de datos, la transformación se aplica a todos los valores de la columna.
Cálculos admitidos para una columna
Puedes realizar los siguientes cálculos en todos los valores de una columna:
Función | Descripción |
---|---|
Valor absoluto | Muestra el valor absoluto de cada valor en una columna. Por ejemplo, el valor absoluto de -10 es 10. |
Agregar | Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila. |
Arccos | Muestra el coseno inverso de cada valor de una columna. |
Arcsinus | Muestra el inverso de pecado para cada valor de una columna. |
Arctan | Muestra el inverso de la tangente para cada valor de una columna. |
Ceil | Muestra el número entero más bajo que sea mayor o igual que el valor numérico en cada celda de una columna. Por ejemplo, si el valor es 2.21, Ceil muestra 3. Si el valor es 5.88, Ceil muestra 6. Si el valor es -5.15, Ceil muestra -5. |
Cos | Muestra el coseno de cada valor de columna. |
Cube | Eleva cada valor de la columna a la potencia de 3. |
Raíz cúbica | Muestra la raíz cúbica de cada valor de la columna. |
Dividir | Divide cada valor de la columna por un decimal positivo o negativo, o bien divide cada valor en dos columnas. |
Piso | Muestra el número entero más alto que sea mayor o igual al valor numérico en cada celda de una columna. Por ejemplo, si el valor es 2.21, PISO muestra 2. Si el valor es 5.88, PISO muestra 5. Del mismo modo, si el valor es -5.15, PISO muestra -6. |
Registro | Muestra el logaritmo de cada valor en una columna. |
Módulo | Muestra el resto cuando se divide cada valor de la columna por un decimal positivo o muestra el resto cuando se divide cada valor de dos columnas. |
Multiplicar | Multiplica cada valor de la columna por un decimal positivo o negativo, o bien multiplica cada valor de dos columnas. |
Registro natural | Muestra el logaritmo natural de cada valor de una columna. |
Poder de | Eleva el valor de la columna a la potencia especificada. |
Aleatorio | Genera valores Double aleatorios e impredecibles en una columna especificada. |
Redonda | Redondea cada valor de una columna. |
Sin | Muestra el seno de cada valor de una columna. |
Cuadrada | Eleva cada valor de la columna a la potencia de 2. |
Raíz cuadrada | Muestra la raíz cuadrada de cada valor de una columna. |
Restar | Resta un decimal positivo o negativo a cada valor de la columna. |
Tan | Muestra la tangente de cada valor en una columna. |
Realiza cálculos numéricos en valores de dos columnas
Para aplicar un cálculo numérico a dos columnas, sigue estos pasos:
- Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, selecciona la casilla de verificación junto a dos nombres de columna.
- Ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
- Selecciona Calcular y elige una opción, por ejemplo, Sumar.
- Opcional: Para crear una columna nueva para los valores calculados, selecciona la casilla de verificación Copiar en una columna nueva. De lo contrario, los valores calculados anula los valores existentes.
- Haz clic en Aplicar.
Los valores cambian según el cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si agregas los valores de cada fila de las columnas Q1_Sales
y Q2_Sales
y creas una columna nueva llamada H1_Sales
, Wrangler agrega la siguiente transformación a la receta:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una columna nueva llamada H1_Sales
con el total de Q1_Sales
y Q2_Sales
.
Cálculos admitidos en dos columnas
Puedes realizar los siguientes cálculos numéricos en los valores de cada fila en dos columnas:
Función | Descripción |
---|---|
Agregar | Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila. |
Promedio | Devuelve el promedio de cada fila en varias columnas. |
Dividir | Divide cada valor de la columna por un decimal positivo o negativo, o bien divide cada valor en dos columnas. |
Igual | Es una función booleana que compara dos columnas para ver si los valores coinciden, fila por fila. Muestra true o false . |
M.C.M. | Muestra el mínimo común múltiplo de cada número en dos columnas. |
Max | Muestra el valor máximo de cada fila en dos columnas. |
Min | Devuelve el valor mínimo de cada fila en dos columnas. |
Módulo | Muestra el resto cuando se divide cada valor de la columna por un decimal positivo o muestra el resto cuando se divide cada valor en dos columnas. |
Multiplicar | Multiplica cada valor de la columna por un decimal positivo o negativo, o bien умножает cada valor en dos columnas. |
Restar | Resta un decimal positivo o negativo a cada valor de la columna. |
Realizar cálculos numéricos en valores de tres o más columnas
Cloud Data Fusion admite realizar cálculos numéricos en valores de tres o más columnas en la versión 6.8.0 y versiones posteriores.
Para aplicar un cálculo numérico a tres o más columnas, sigue estos pasos:
- Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, selecciona la casilla de verificación junto a dos nombres de columna.
- Ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
- Selecciona Calcular y elige una opción, por ejemplo, Sumar.
- Opcional: Para crear una columna nueva para los valores calculados, selecciona la casilla de verificación Copiar en una columna nueva. De lo contrario, los valores calculados anula los valores existentes.
- Haz clic en Aplicar.
Los valores cambian según el cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si agregas los valores de cada fila de las columnas Q1_Sales
, Q2_Sales
, Q3_Sales
y Q4_Sales
y creas una columna nueva llamada 2022_Sales
, Wrangler agrega la siguiente transformación a la receta:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una
columna nueva llamada 2022_Sales
con el total de Q1_Sales
, Q2_Sales
,
Q3_Sales
y Q4_Sales
.
Cálculos admitidos en tres o más columnas
Puedes realizar los siguientes cálculos en los valores de cada fila en tres o más columnas:
Función | Descripción |
---|---|
Agregar | Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila. |
Promedio | Devuelve el promedio de cada fila en varias columnas. |
Igual | Es una función booleana que compara dos columnas para ver si los valores coinciden, fila por fila. Muestra true o false . |
Max | Muestra el valor máximo de cada fila en dos columnas. |
Min | Devuelve el valor mínimo de cada fila en dos columnas. |
Multiplicar | Multiplica cada valor de la columna por un decimal positivo o negativo, o bien умножает cada valor en dos columnas. |
¿Qué sigue?
- Obtén más información sobre las directivas de Wrangler.