Cette page explique comment effectuer des calculs numériques lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.
Vous pouvez effectuer ces transformations dans les colonnes des types de données suivants:
- Integer
- Decimal
- Double
- Float
- Long
- Version courte
Pour en savoir plus, consultez la directive set-column
.
Vous pouvez utiliser des fonctions numériques sur une ou plusieurs colonnes. Les fonctions numériques disponibles varient en fonction du nombre de colonnes que vous sélectionnez. Vous pouvez choisir de créer une colonne contenant les résultats des calculs ou de les afficher dans la colonne où vous ajoutez la transformation.
Si vous appliquez une fonction numérique à une seule colonne, le comportement est différent que si vous appliquez une fonction numérique à plusieurs colonnes. Exemple :
- Si vous utilisez la fonction
Multiply()
sur une seule colonne, vous spécifiez la valeur décimale à multiplier par chaque valeur de la colonne. Wrangler effectue la multiplication sur les données d'exemple et affiche les nouvelles valeurs dans la même colonne ou dans une nouvelle colonne. - Si vous utilisez la fonction
Multiply()
sur plusieurs colonnes, Wrangler multiplie les valeurs de chaque ligne pour les colonnes sélectionnées et affiche les nouvelles valeurs dans la première colonne de la transformation.
Effectuer des calculs numériques sur les valeurs d'une colonne
Pour appliquer un calcul numérique à une colonne, procédez comme suit:
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
Sélectionnez Calculer, puis une option (par exemple, Ajouter).
Pour effectuer le calcul, certaines fonctions vous demandent de saisir une valeur décimale. Par exemple, si vous sélectionnez Soustraire, vous devez saisir la valeur à soustraire de chaque ligne.
Facultatif: Pour créer une colonne pour les valeurs calculées, cochez la case Copier dans une nouvelle colonne.
Cliquez sur Appliquer.
Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous soustrayez deux de chaque valeur de la colonne Price
, Wrangler ajoute la transformation suivante à la recette:
set-column :Price Price - 2
Lorsque vous exécutez le pipeline de données, la transformation est appliquée à toutes les valeurs de la colonne.
Calculs compatibles pour une colonne
Vous pouvez effectuer les calculs suivants sur toutes les valeurs d'une colonne:
Fonction | Description |
---|---|
Valeur absolue | Renvoie la valeur absolue de chaque valeur d'une colonne. Par exemple, la valeur absolue de -10 est 10. |
Ajouter | Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne. |
Arccos | Renvoie la valeur inverse du cosinus pour chaque valeur d'une colonne. |
Arcsin | Renvoie l'inverse de la fonction sinus pour chaque valeur d'une colonne. |
Arctan | Renvoie la tangente inverse de chaque valeur d'une colonne. |
Ceil | Renvoie le plus petit nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, Ceil renvoie 3. Si la valeur est 5,88, Ceil renvoie 6. Si la valeur est -5,15, Ceil renvoie -5. |
Cos | Renvoie le cosinus de chaque valeur de colonne. |
Cube | Élève chaque valeur de la colonne à la puissance 3. |
Racine cubique | Renvoie la racine cubique de chaque valeur de la colonne. |
Diviser | Divisez chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divisez chaque valeur en deux colonnes. |
Étage | Renvoie le plus grand nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, FLOOR renvoie 2. Si la valeur est 5,88, FLOOR renvoie 5. De même, si la valeur est -5,15, FLOOR renvoie -6. |
Journal | Renvoie le logarithme de chaque valeur d'une colonne. |
Modulo | Renvoie le reste obtenu en divisant chaque valeur de la colonne par un nombre décimal positif ou le reste obtenu en divisant chaque valeur de deux colonnes. |
Multiplier | Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes. |
Log naturel | Renvoie le logarithme naturel de chaque valeur d'une colonne. |
Pouvoir de | Élève la valeur de la colonne à la puissance spécifiée. |
Aléatoire | Génère des valeurs Double aléatoires et imprévisibles dans une colonne spécifiée. |
Round | Arrondit chaque valeur d'une colonne. |
Sin | Renvoie le sinus de chaque valeur d'une colonne. |
Carré | Élève chaque valeur de la colonne à la puissance 2. |
Racine carrée | Renvoie la racine carrée de chaque valeur d'une colonne. |
Soustraire | Soustrait un nombre décimal positif ou négatif à chaque valeur de la colonne. |
Tan | Renvoie la tangente pour chaque valeur d'une colonne. |
Effectuer des calculs numériques sur les valeurs de deux colonnes
Pour appliquer un calcul numérique à deux colonnes, procédez comme suit:
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
- Sélectionnez Calculer, puis une option (par exemple, Ajouter).
- Facultatif: Pour créer une colonne pour les valeurs calculées, cochez la case Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent les valeurs existantes.
- Cliquez sur Appliquer.
Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales
et Q2_Sales
, et que vous créez une colonne appelée H1_Sales
, Wrangler ajoute la transformation suivante à la recette:
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée H1_Sales
avec le total de Q1_Sales
et Q2_Sales
.
Calculs acceptés dans deux colonnes
Vous pouvez effectuer les calculs numériques suivants sur les valeurs de chaque ligne dans deux colonnes:
Fonction | Description |
---|---|
Ajouter | Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne. |
Moyenne | Renvoie la moyenne de chaque ligne de plusieurs colonnes. |
Diviser | Divisez chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divisez chaque valeur en deux colonnes. |
Égal à | Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false . |
LCM | Renvoie le plus petit commun multiple de chaque nombre dans deux colonnes. |
Max | Renvoie la valeur maximale pour chaque ligne dans deux colonnes. |
Min | Renvoie la valeur minimale pour chaque ligne de deux colonnes. |
Modulo | Renvoie le reste obtenu en divisant chaque valeur de la colonne par un nombre décimal positif ou le reste obtenu en divisant chaque valeur de deux colonnes. |
Multiplier | Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes. |
Soustraire | Soustraie un nombre décimal positif ou négatif à chaque valeur de la colonne. |
Effectuer des calculs numériques sur les valeurs de trois colonnes ou plus
Cloud Data Fusion permet d'effectuer des calculs numériques sur les valeurs de trois colonnes ou plus à partir de la version 6.8.0.
Pour appliquer un calcul numérique à trois colonnes ou plus, procédez comme suit:
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
- Sélectionnez Calculer, puis une option (par exemple, Ajouter).
- Facultatif: Pour créer une colonne pour les valeurs calculées, cochez la case Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent les valeurs existantes.
- Cliquez sur Appliquer.
Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales
, Q2_Sales
, Q3_Sales
et Q4_Sales
, et que vous créez une nouvelle colonne appelée 2022_Sales
, Wrangler ajoute la transformation suivante à la recette:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée 2022_Sales
avec le total de Q1_Sales
, Q2_Sales
, Q3_Sales
et Q4_Sales
.
Calculs compatibles dans trois colonnes ou plus
Vous pouvez effectuer les calculs suivants sur les valeurs de chaque ligne dans trois colonnes ou plus:
Fonction | Description |
---|---|
Ajouter | Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne. |
Moyenne | Renvoie la moyenne de chaque ligne de plusieurs colonnes. |
Égal à | Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false . |
Max | Renvoie la valeur maximale pour chaque ligne dans deux colonnes. |
Min | Renvoie la valeur minimale pour chaque ligne de deux colonnes. |
Multiplier | Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes. |
Étape suivante
- En savoir plus sur les directives Wrangler