Travailler avec des numéros

Cette page explique comment effectuer des calculs numériques lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.

Vous pouvez effectuer ces transformations dans des colonnes contenant les types de données suivants:

  • Integer
  • Decimal
  • Double
  • Float
  • Long
  • Version courte

Pour en savoir plus, consultez la directive set-column.

Vous pouvez utiliser des fonctions numériques sur une ou plusieurs colonnes. Les fonctions numériques disponibles varient en fonction du nombre de colonnes que vous sélectionnez. Vous pouvez choisir de créer nouvelle colonne avec les résultats des calculs, ou vous pouvez obtenir les résultats dans la colonne où vous ajoutez la transformation.

Si vous appliquez une fonction numérique à une seule colonne, le comportement est différent que si vous appliquez une fonction numérique à plusieurs colonnes. Exemple :

  • Si vous utilisez la fonction Multiply() sur une seule colonne, vous devez spécifier la valeur décimale par laquelle multiplier chaque valeur de la colonne. Wrangler effectue la multiplication sur les données d'exemple et affiche les nouvelles valeurs dans la même colonne ou dans une nouvelle colonne.
  • Si vous utilisez la fonction Multiply() sur plusieurs colonnes, Wrangler multiplie les valeurs de chaque ligne pour les colonnes sélectionnées et affiche les nouvelles valeurs dans la première colonne de la transformation.

Effectuer des calculs numériques sur les valeurs d'une colonne

Pour appliquer un calcul numérique à une colonne, procédez comme suit :

  1. Accéder à l'espace de travail Wrangler dans Cloud Data Fusion
  2. Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
  3. Sélectionnez Calculer, puis choisissez une option, par exemple Ajouter.

    Pour effectuer le calcul, certaines fonctions nécessitent que vous saisissiez un nombre décimal . Par exemple, si vous sélectionnez Soustraire, vous devez saisir la valeur à soustraire de chaque ligne.

  4. Facultatif: pour créer une colonne pour les valeurs calculées, sélectionnez la Copier dans une nouvelle colonne.

  5. Cliquez sur Appliquer.

Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous soustrayez deux de chaque valeur de la colonne Price, Wrangler ajoute la transformation suivante à la recette :

set-column :Price Price - 2

Lorsque vous exécutez le pipeline de données, la transformation est appliquée à toutes les valeurs dans la colonne.

Calculs acceptés pour une colonne

Vous pouvez effectuer les calculs suivants sur toutes les valeurs d'une colonne :

Fonction Description
Valeur absolue Renvoie la valeur absolue de chaque valeur d'une colonne. Par exemple : la valeur absolue de -10 est de 10.
Ajouter Ajoute un nombre décimal positif ou négatif à une colonne, ou ajoute plusieurs nombres décimaux colonnes pour générer la somme de chaque ligne.
Arccos Renvoie la valeur inverse du cosinus pour chaque valeur d'une colonne.
Arcsin Renvoie l'inverse de la fonction sinus pour chaque valeur d'une colonne.
Arctan Renvoie l'inverse de la tangente pour chaque valeur d'une colonne.
Ceil Renvoie le plus petit nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, Ceil renvoie 3. Si la valeur est 5,88, Ceil renvoie 6. Si la valeur est -5.15, Ceil renvoie -5.
Cos Renvoie le cosinus de chaque valeur de colonne.
Cube Élève chaque valeur de la colonne à la puissance 3.
Racine cubique Renvoie la racine cubique de chaque valeur de la colonne.
Diviser Divise chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divise chaque valeur en deux colonnes.
Étage Renvoie le plus grand nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, FLOOR renvoie 2. Si la valeur est 5,88, FLOOR renvoie 5. De même, si la valeur est -5.15, FLOOR renvoie -6.
Journal Renvoie le logarithme de chaque valeur d'une colonne.
Modulo Renvoie le reste en divisant chaque valeur de la colonne par une décimale positive ou renvoie le reste lors de la division de chaque valeur dans deux colonnes.
Multiplier Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes.
Journal naturel Renvoie le logarithme naturel de chaque valeur d'une colonne.
Pouvoir de Élève la valeur de la colonne à la puissance spécifiée.
Aléatoire Génère des valeurs Double aléatoires et imprévisibles dans une colonne spécifiée.
Ronde Arrondit chaque valeur d'une colonne.
Péché Renvoie le sin pour chaque valeur d'une colonne.
Carré Élève chaque valeur de la colonne à la puissance 2.
Racine carrée Renvoie la racine carrée de chaque valeur dans une colonne.
Soustraire Soustrait un nombre décimal positif ou négatif à chaque valeur de la colonne.
Tan Renvoie la tangente pour chaque valeur d'une colonne.

Effectuer des calculs numériques sur les valeurs de deux colonnes

Pour appliquer un calcul numérique à deux colonnes, procédez comme suit:

  1. Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
  2. Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
  3. Accédez à un nom de colonne et cliquez sur le arrow_drop_down flèche de développement.
  4. Sélectionnez Calculer, puis une option (par exemple, Ajouter).
  5. Facultatif: pour créer une colonne pour les valeurs calculées, sélectionnez la Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent valeurs existantes.
  6. Cliquez sur Appliquer.

Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales et Q2_Sales, et que vous créez une colonne appelée H1_Sales, Wrangler ajoute la transformation suivante à la recette :

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée H1_Sales, avec un total de Q1_Sales et Q2_Sales.

Calculs acceptés dans deux colonnes

Vous pouvez effectuer les calculs numériques suivants sur les valeurs de chaque ligne dans deux colonnes :

Fonction Description
Ajouter Ajoute un nombre décimal positif ou négatif à une colonne, ou ajoute plusieurs colonnes pour générer la somme de chaque ligne.
Moyenne Renvoie la moyenne de chaque ligne dans plusieurs colonnes.
Diviser Divisez chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divisez chaque valeur en deux colonnes.
Égal à Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false.
LCM Renvoie le plus petit commun multiple de chaque nombre dans deux colonnes.
Max Renvoie la valeur maximale pour chaque ligne dans deux colonnes.
Min Renvoie la valeur minimale pour chaque ligne de deux colonnes.
Modulo Renvoie le reste en divisant chaque valeur de la colonne par une décimale positive ou renvoie le reste en divisant chaque valeur en deux colonnes.
Multiplier Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes.
Soustraire Soustraie un nombre décimal positif ou négatif à chaque valeur de la colonne.

Effectuer des calculs numériques sur les valeurs de trois colonnes ou plus

Cloud Data Fusion permet d'effectuer des calculs numériques sur des valeurs trois colonnes ou plus à partir de la version 6.8.0.

Pour appliquer un calcul numérique à trois colonnes ou plus, procédez comme suit:

  1. Accéder à l'espace de travail Wrangler dans Cloud Data Fusion
  2. Dans l'onglet Données, cochez la case correspondant à deux noms de colonnes.
  3. Accédez à un nom de colonne et cliquez sur le arrow_drop_down flèche de développement.
  4. Sélectionnez Calculer, puis une option (par exemple, Ajouter).
  5. Facultatif: pour créer une colonne pour les valeurs calculées, sélectionnez la Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent valeurs existantes.
  6. Cliquez sur Appliquer.

Les valeurs changent en fonction du calcul. Wrangler ajoute le code comme étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales, Q2_Sales, Q3_Sales et Q4_Sales, puis créez un colonne appelée 2022_Sales, Wrangler ajoute la transformation suivante à la recette:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée 2022_Sales avec le total de Q1_Sales, Q2_Sales, Q3_Sales et Q4_Sales.

Calculs compatibles dans trois colonnes ou plus

Vous pouvez effectuer les calculs suivants sur les valeurs de chaque ligne dans trois ou d'autres colonnes:

Fonction Description
Ajouter Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne.
Moyenne Renvoie la moyenne de chaque ligne de plusieurs colonnes.
Égal à Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false.
Max Renvoie la valeur maximale pour chaque ligne dans deux colonnes.
Min Renvoie la valeur minimale pour chaque ligne de deux colonnes.
Multiplier Il multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur en deux colonnes.

Étape suivante