Esta página explica cómo realizar cálculos numéricos cuando preparas datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.
Puedes realizar estas transformaciones en columnas de los siguientes tipos de datos:
- Número entero
- Decimal
- Doble
- Número de punto flotante
- Largo
- Brevedad normal
Para obtener más información, consulta la directiva set-column
.
Puedes usar funciones numéricas en una o más columnas. Son los valores numéricos varían según la cantidad de columnas que selecciones. Puedes optar por crear nueva columna con los resultados de los cálculos, o puedes tener los resultados en la columna en la que agregas la transformación.
Si aplicas una regla función a una sola columna, el comportamiento es diferente que si aplicas una función numérica a varias columnas. Por ejemplo:
- Si usas la función
Multiply()
en una sola columna, debes especificar valor decimal para multiplicar cada valor en la columna. Wrangler realiza multiplicaciones en los datos de la muestra y muestra los valores nuevos de la misma columna o en una nueva columna. - Si usas la función
Multiply()
en varias columnas, Wrangler умножает los valores de cada fila de las columnas seleccionadas y muestra los valores nuevos en la primera columna de la transformación.
Realizar cálculos numéricos sobre los valores de una columna
Para aplicar un cálculo numérico a una columna, sigue estos pasos:
- Ve al lugar de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
Selecciona Calcular y elige una opción, por ejemplo, Sumar.
Para completar el cálculo, algunas funciones requieren que ingreses un decimal valor. Por ejemplo, si seleccionas Restar, debes ingresar el valor que se resta de cada fila.
Opcional: Para crear una columna nueva para los valores calculados, selecciona el Casilla de verificación Copy to a new column.
Haz clic en Aplicar.
Los valores cambian según el cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si restas dos a cada uno
en la columna Price
, Wrangler agrega la siguiente transformación al
receta:
set-column :Price Price - 2
Cuando ejecutas la canalización de datos, la transformación se aplica a todos los valores en la columna.
Cálculos admitidos para una columna
Puedes realizar los siguientes cálculos en todos los valores de una columna:
Función | Descripción |
---|---|
Valor absoluto | Muestra el valor absoluto de cada valor en una columna. Por ejemplo, el valor absoluto de -10 es 10. |
Agregar | Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila. |
Arccos | Muestra el coseno inverso de cada valor de una columna. |
Arcsinus | Muestra el inverso de pecado para cada valor de una columna. |
Arctan | Muestra el inverso de la tangente para cada valor de una columna. |
Ceil | Devuelve el número entero más bajo que sea superior o igual al valor numérico. valor en cada celda de una columna. Por ejemplo, si el valor es 2.21, Ceil muestra 3. Si el valor es 5.88, Ceil muestra 6. Si el valor es -5.15, Ceil devuelve -5. |
Cos | Muestra el coseno de cada valor de columna. |
Cube | Eleva cada valor de la columna a la potencia de 3. |
Raíz cúbica | Muestra la raíz cúbica de cada valor de la columna. |
Dividir | Si divides cada valor en la columna por un decimal positivo o negativo, o divide cada valor en dos columnas. |
Piso | Muestra el número entero más alto que sea mayor o igual al valor numérico en cada celda de una columna. Por ejemplo, si el valor es 2.21, MULTIPLO.INFERIOR devuelve 2. Si el valor es 5.88, PISO muestra 5. Del mismo modo, si el valor es -5.15, PISO muestra -6. |
Registro | Muestra el logaritmo de cada valor en una columna. |
Modulo | Muestra el resto cuando se divide cada valor de la columna por un decimal positivo o muestra el resto cuando se divide cada valor de dos columnas. |
Multiplicar | Multiplica cada valor de la columna por un decimal positivo o negativo, o bien multiplica cada valor en dos columnas. |
Registro natural | Muestra el logaritmo natural de cada valor en una columna. |
Poder de | Eleva el valor de la columna a la potencia especificada. |
Aleatorio | Genera valores dobles impredecibles y aleatorios en un rango . |
Redonda | Redondea cada valor de una columna. |
Pequeño | Muestra el seno de cada valor de una columna. |
Cuadrada | Eleva cada valor de la columna a la potencia de 2. |
Raíz cuadrada | Muestra la raíz cuadrada de cada valor de una columna. |
Sustraer | Resta un decimal positivo o negativo a cada valor de la columna. |
Marrón | Muestra la tangente de cada valor en una columna. |
Realizar cálculos numéricos en valores de dos columnas
Para aplicar un cálculo numérico a dos columnas, sigue estos pasos:
- Ve al lugar de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, selecciona la casilla de verificación junto a dos nombres de columna.
- Ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
- Selecciona Calculate y, luego, una opción, por ejemplo, Add.
- Opcional: Para crear una columna nueva para los valores calculados, selecciona el Casilla de verificación Copy to a new column. De lo contrario, los valores calculados anula los valores existentes.
- Haz clic en Aplicar.
Los valores cambian en función del cálculo. Wrangler agrega el conjunto de
directiva como paso en la receta. Por ejemplo, si sumas los valores en cada fila
de las columnas Q1_Sales
y Q2_Sales
, y crea una nueva llamada
H1_Sales
, Wrangler agrega la siguiente transformación a la receta:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una columna nueva llamada H1_Sales
con el total de Q1_Sales
y Q2_Sales
.
Cálculos admitidos en dos columnas
Puedes realizar los siguientes cálculos numéricos sobre los valores de cada fila en dos columnas:
Función | Descripción |
---|---|
Agregar | Agrega un decimal positivo o negativo a una columna o varias columnas para mostrar la suma de cada fila. |
Promedio | Devuelve el promedio de cada fila en varias columnas. |
Dividir | Si divides cada valor en la columna por un decimal positivo o negativo, o divide cada valor en dos columnas. |
Igual | Función booleana que compara dos columnas para ver si los valores coinciden, fila
por fila. Muestra true o false . |
LCM | Muestra el mínimo común múltiplo de cada número en dos columnas. |
Max | Muestra el valor máximo de cada fila en dos columnas. |
Min | Devuelve el valor mínimo de cada fila en dos columnas. |
Módulo | Devuelve el resto cuando divides cada valor de la columna por un decimal positivo o devuelve el resto cuando se divide cada valor en dos columnas. |
Multiplicar | Multiplica cada valor de la columna por un decimal positivo o negativo, o bien умножает cada valor en dos columnas. |
Restar | Resta un decimal positivo o negativo a cada valor de la columna. |
Realizar cálculos numéricos en valores de tres o más columnas
Cloud Data Fusion admite la realización de cálculos numéricos sobre valores en tres o más columnas en la versión 6.8.0 y posteriores.
Para aplicar un cálculo numérico a tres o más columnas, sigue estos pasos:
- Ve al lugar de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, selecciona la casilla de verificación junto a dos nombres de columna.
- Ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
- Selecciona Calculate y, luego, una opción, por ejemplo, Add.
- Opcional: Para crear una columna nueva para los valores calculados, selecciona el Casilla de verificación Copy to a new column. De lo contrario, los valores calculados anula los valores existentes.
- Haz clic en Aplicar.
Los valores cambian en función del cálculo. Wrangler agrega la directiva correspondiente como un paso en la receta. Por ejemplo, si agregas los valores de cada fila de las columnas Q1_Sales
, Q2_Sales
, Q3_Sales
y Q4_Sales
y creas una columna nueva llamada 2022_Sales
, Wrangler agrega la siguiente transformación a la receta:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Cuando ejecutas la canalización de datos, Wrangler realiza la transformación y crea una
columna nueva llamada 2022_Sales
con el total de Q1_Sales
, Q2_Sales
,
Q3_Sales
y Q4_Sales
.
Cálculos admitidos en tres o más columnas
Puedes realizar los siguientes cálculos sobre los valores de cada fila en tres o columnas adicionales:
Función | Descripción |
---|---|
Agregar | Agrega un decimal positivo o negativo a una columna o varias columnas para obtener la suma de cada fila. |
Promedio | Muestra el promedio de cada fila en varias columnas. |
Igual | Es una función booleana que compara dos columnas para ver si los valores coinciden, fila por fila. Muestra true o false . |
Máx. | Muestra el valor máximo de cada fila en dos columnas. |
min | Muestra el valor mínimo de cada fila en dos columnas. |
Multiplicar | Multiplica cada valor de la columna por un decimal positivo o negativo, o multiplica cada valor en dos columnas. |
¿Qué sigue?
- Obtén más información sobre las directivas de Wrangler.