Cette page explique comment effectuer des calculs numériques lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.
Vous pouvez effectuer ces transformations dans des colonnes contenant les types de données suivants:
- Integer
- Decimal
- Double
- Float
- Long
- Version courte
Pour en savoir plus, consultez la directive set-column
.
Vous pouvez utiliser des fonctions numériques sur une ou plusieurs colonnes. Les fonctions numériques disponibles varient en fonction du nombre de colonnes que vous sélectionnez. Vous pouvez choisir de créer nouvelle colonne avec les résultats des calculs, ou vous pouvez obtenir les résultats dans la colonne où vous ajoutez la transformation.
Si vous appliquez une fonction numérique à une seule colonne, le comportement est différent que si vous appliquez une fonction numérique à plusieurs colonnes. Exemple :
- Si vous utilisez la fonction
Multiply()
sur une seule colonne, vous devez spécifier la valeur décimale par laquelle multiplier chaque valeur de la colonne. Wrangler effectue la multiplication sur les données d'exemple et affiche les nouvelles valeurs dans la même colonne ou dans une nouvelle colonne. - Si vous utilisez la fonction
Multiply()
sur plusieurs colonnes, Wrangler multiplie les valeurs de chaque ligne pour les colonnes sélectionnées et affiche les nouvelles valeurs dans la première colonne de la transformation.
Effectuer des calculs numériques sur les valeurs d'une colonne
Pour appliquer un calcul numérique à une colonne, procédez comme suit :
- Accéder à l'espace de travail Wrangler dans Cloud Data Fusion
- Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
Sélectionnez Calculer, puis choisissez une option, par exemple Ajouter.
Pour effectuer le calcul, certaines fonctions nécessitent que vous saisissiez un nombre décimal . Par exemple, si vous sélectionnez Soustraire, vous devez saisir la valeur à soustraire de chaque ligne.
Facultatif: pour créer une colonne pour les valeurs calculées, sélectionnez la Copier dans une nouvelle colonne.
Cliquez sur Appliquer.
Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous soustrayez deux de chaque valeur de la colonne Price
, Wrangler ajoute la transformation suivante à la recette :
set-column :Price Price - 2
Lorsque vous exécutez le pipeline de données, la transformation est appliquée à toutes les valeurs dans la colonne.
Calculs acceptés pour une colonne
Vous pouvez effectuer les calculs suivants sur toutes les valeurs d'une colonne :
Fonction | Description |
---|---|
Valeur absolue | Renvoie la valeur absolue de chaque valeur d'une colonne. Par exemple : la valeur absolue de -10 est de 10. |
Ajouter | Ajoute un nombre décimal positif ou négatif à une colonne, ou ajoute plusieurs nombres décimaux colonnes pour générer la somme de chaque ligne. |
Arccos | Renvoie la valeur inverse du cosinus pour chaque valeur d'une colonne. |
Arcsin | Renvoie l'inverse de la fonction sinus pour chaque valeur d'une colonne. |
Arctan | Renvoie l'inverse de la tangente pour chaque valeur d'une colonne. |
Ceil | Renvoie le plus petit nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, Ceil renvoie 3. Si la valeur est 5,88, Ceil renvoie 6. Si la valeur est -5.15, Ceil renvoie -5. |
Cos | Renvoie le cosinus de chaque valeur de colonne. |
Cube | Élève chaque valeur de la colonne à la puissance 3. |
Racine cubique | Renvoie la racine cubique de chaque valeur de la colonne. |
Diviser | Divise chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divise chaque valeur en deux colonnes. |
Étage | Renvoie le plus grand nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, FLOOR renvoie 2. Si la valeur est 5,88, FLOOR renvoie 5. De même, si la valeur est -5.15, FLOOR renvoie -6. |
Journal | Renvoie le logarithme de chaque valeur d'une colonne. |
Modulo | Renvoie le reste en divisant chaque valeur de la colonne par une décimale positive ou renvoie le reste lors de la division de chaque valeur dans deux colonnes. |
Multiplier | Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes. |
Journal naturel | Renvoie le logarithme naturel de chaque valeur d'une colonne. |
Pouvoir de | Élève la valeur de la colonne à la puissance spécifiée. |
Aléatoire | Génère des valeurs Double aléatoires et imprévisibles dans une colonne spécifiée. |
Ronde | Arrondit chaque valeur d'une colonne. |
Péché | Renvoie le sin pour chaque valeur d'une colonne. |
Carré | Élève chaque valeur de la colonne à la puissance 2. |
Racine carrée | Renvoie la racine carrée de chaque valeur dans une colonne. |
Soustraire | Soustrait un nombre décimal positif ou négatif à chaque valeur de la colonne. |
Tan | Renvoie la tangente pour chaque valeur d'une colonne. |
Effectuer des calculs numériques sur les valeurs de deux colonnes
Pour appliquer un calcul numérique à deux colonnes, procédez comme suit:
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Accédez à un nom de colonne et cliquez sur le arrow_drop_down flèche de développement.
- Sélectionnez Calculer, puis une option (par exemple, Ajouter).
- Facultatif: pour créer une colonne pour les valeurs calculées, sélectionnez la Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent valeurs existantes.
- Cliquez sur Appliquer.
Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales
et Q2_Sales
, et que vous créez une colonne appelée H1_Sales
, Wrangler ajoute la transformation suivante à la recette :
set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)
Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée
une nouvelle colonne appelée H1_Sales
, avec un total de Q1_Sales
et Q2_Sales
.
Calculs acceptés dans deux colonnes
Vous pouvez effectuer les calculs numériques suivants sur les valeurs de chaque ligne dans deux colonnes :
Fonction | Description |
---|---|
Ajouter | Ajoute un nombre décimal positif ou négatif à une colonne, ou ajoute plusieurs colonnes pour générer la somme de chaque ligne. |
Moyenne | Renvoie la moyenne de chaque ligne dans plusieurs colonnes. |
Diviser | Divisez chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divisez chaque valeur en deux colonnes. |
Égal à | Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false . |
LCM | Renvoie le plus petit commun multiple de chaque nombre dans deux colonnes. |
Max | Renvoie la valeur maximale pour chaque ligne dans deux colonnes. |
Min | Renvoie la valeur minimale pour chaque ligne de deux colonnes. |
Modulo | Renvoie le reste en divisant chaque valeur de la colonne par une décimale positive ou renvoie le reste en divisant chaque valeur en deux colonnes. |
Multiplier | Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes. |
Soustraire | Soustraie un nombre décimal positif ou négatif à chaque valeur de la colonne. |
Effectuer des calculs numériques sur les valeurs de trois colonnes ou plus
Cloud Data Fusion permet d'effectuer des calculs numériques sur des valeurs trois colonnes ou plus à partir de la version 6.8.0.
Pour appliquer un calcul numérique à trois colonnes ou plus, procédez comme suit:
- Accéder à l'espace de travail Wrangler dans Cloud Data Fusion
- Dans l'onglet Données, cochez la case correspondant à deux noms de colonnes.
- Accédez à un nom de colonne et cliquez sur le arrow_drop_down flèche de développement.
- Sélectionnez Calculer, puis une option (par exemple, Ajouter).
- Facultatif: pour créer une colonne pour les valeurs calculées, sélectionnez la Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent valeurs existantes.
- Cliquez sur Appliquer.
Les valeurs changent en fonction du calcul. Wrangler ajoute le code
comme étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne
des colonnes Q1_Sales
, Q2_Sales
, Q3_Sales
et Q4_Sales
, puis créez un
colonne appelée 2022_Sales
, Wrangler ajoute la transformation suivante à
la recette:
set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)
Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée 2022_Sales
avec le total de Q1_Sales
, Q2_Sales
, Q3_Sales
et Q4_Sales
.
Calculs compatibles dans trois colonnes ou plus
Vous pouvez effectuer les calculs suivants sur les valeurs de chaque ligne dans trois ou d'autres colonnes:
Fonction | Description |
---|---|
Ajouter | Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne. |
Moyenne | Renvoie la moyenne de chaque ligne de plusieurs colonnes. |
Égal à | Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false . |
Max | Renvoie la valeur maximale pour chaque ligne dans deux colonnes. |
Min | Renvoie la valeur minimale pour chaque ligne de deux colonnes. |
Multiplier | Il multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur en deux colonnes. |
Étape suivante
- En savoir plus sur les directives Wrangler