Utiliser des nombres

Cette page explique comment effectuer des calculs numériques lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.

Vous pouvez effectuer ces transformations dans les colonnes des types de données suivants:

  • Integer
  • Decimal
  • Double
  • Float
  • Long
  • Version courte

Pour en savoir plus, consultez la directive set-column.

Vous pouvez utiliser des fonctions numériques sur une ou plusieurs colonnes. Les fonctions numériques disponibles varient en fonction du nombre de colonnes que vous sélectionnez. Vous pouvez choisir de créer une colonne contenant les résultats des calculs ou de les afficher dans la colonne où vous ajoutez la transformation.

Si vous appliquez une fonction numérique à une seule colonne, le comportement est différent que si vous appliquez une fonction numérique à plusieurs colonnes. Exemple :

  • Si vous utilisez la fonction Multiply() sur une seule colonne, vous spécifiez la valeur décimale à multiplier par chaque valeur de la colonne. Wrangler effectue la multiplication sur les données d'exemple et affiche les nouvelles valeurs dans la même colonne ou dans une nouvelle colonne.
  • Si vous utilisez la fonction Multiply() sur plusieurs colonnes, Wrangler multiplie les valeurs de chaque ligne pour les colonnes sélectionnées et affiche les nouvelles valeurs dans la première colonne de la transformation.

Effectuer des calculs numériques sur les valeurs d'une colonne

Pour appliquer un calcul numérique à une colonne, procédez comme suit:

  1. Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
  2. Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
  3. Sélectionnez Calculer, puis une option (par exemple, Ajouter).

    Pour effectuer le calcul, certaines fonctions vous demandent de saisir une valeur décimale. Par exemple, si vous sélectionnez Soustraire, vous devez saisir la valeur à soustraire de chaque ligne.

  4. Facultatif: Pour créer une colonne pour les valeurs calculées, cochez la case Copier dans une nouvelle colonne.

  5. Cliquez sur Appliquer.

Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous soustrayez deux de chaque valeur de la colonne Price, Wrangler ajoute la transformation suivante à la recette:

set-column :Price Price - 2

Lorsque vous exécutez le pipeline de données, la transformation est appliquée à toutes les valeurs de la colonne.

Calculs compatibles pour une colonne

Vous pouvez effectuer les calculs suivants sur toutes les valeurs d'une colonne:

Fonction Description
Valeur absolue Renvoie la valeur absolue de chaque valeur d'une colonne. Par exemple, la valeur absolue de -10 est 10.
Ajouter Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne.
Arccos Renvoie la valeur inverse du cosinus pour chaque valeur d'une colonne.
Arcsin Renvoie l'inverse de la fonction sinus pour chaque valeur d'une colonne.
Arctan Renvoie la tangente inverse de chaque valeur d'une colonne.
Ceil Renvoie le plus petit nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, Ceil renvoie 3. Si la valeur est 5,88, Ceil renvoie 6. Si la valeur est -5,15, Ceil renvoie -5.
Cos Renvoie le cosinus de chaque valeur de colonne.
Cube Élève chaque valeur de la colonne à la puissance 3.
Racine cubique Renvoie la racine cubique de chaque valeur de la colonne.
Diviser Divisez chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divisez chaque valeur en deux colonnes.
Étage Renvoie le plus grand nombre entier supérieur ou égal à la valeur numérique dans chaque cellule d'une colonne. Par exemple, si la valeur est 2,21, FLOOR renvoie 2. Si la valeur est 5,88, FLOOR renvoie 5. De même, si la valeur est -5,15, FLOOR renvoie -6.
Journal Renvoie le logarithme de chaque valeur d'une colonne.
Modulo Renvoie le reste obtenu en divisant chaque valeur de la colonne par un nombre décimal positif ou le reste obtenu en divisant chaque valeur de deux colonnes.
Multiplier Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes.
Log naturel Renvoie le logarithme naturel de chaque valeur d'une colonne.
Pouvoir de Élève la valeur de la colonne à la puissance spécifiée.
Aléatoire Génère des valeurs Double aléatoires et imprévisibles dans une colonne spécifiée.
Round Arrondit chaque valeur d'une colonne.
Sin Renvoie le sinus de chaque valeur d'une colonne.
Carré Élève chaque valeur de la colonne à la puissance 2.
Racine carrée Renvoie la racine carrée de chaque valeur d'une colonne.
Soustraire Soustrait un nombre décimal positif ou négatif à chaque valeur de la colonne.
Tan Renvoie la tangente pour chaque valeur d'une colonne.

Effectuer des calculs numériques sur les valeurs de deux colonnes

Pour appliquer un calcul numérique à deux colonnes, procédez comme suit:

  1. Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
  2. Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
  3. Accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
  4. Sélectionnez Calculer, puis une option (par exemple, Ajouter).
  5. Facultatif: Pour créer une colonne pour les valeurs calculées, cochez la case Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent les valeurs existantes.
  6. Cliquez sur Appliquer.

Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales et Q2_Sales, et que vous créez une colonne appelée H1_Sales, Wrangler ajoute la transformation suivante à la recette:

set-column :H1_Sales arithmetic:add(Q1_Sales, Q2_Sales)

Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée H1_Sales avec le total de Q1_Sales et Q2_Sales.

Calculs acceptés dans deux colonnes

Vous pouvez effectuer les calculs numériques suivants sur les valeurs de chaque ligne dans deux colonnes:

Fonction Description
Ajouter Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne.
Moyenne Renvoie la moyenne de chaque ligne de plusieurs colonnes.
Diviser Divisez chaque valeur de la colonne par un nombre décimal positif ou négatif, ou divisez chaque valeur en deux colonnes.
Égal à Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false.
LCM Renvoie le plus petit commun multiple de chaque nombre dans deux colonnes.
Max Renvoie la valeur maximale pour chaque ligne dans deux colonnes.
Min Renvoie la valeur minimale pour chaque ligne de deux colonnes.
Modulo Renvoie le reste obtenu en divisant chaque valeur de la colonne par un nombre décimal positif ou le reste obtenu en divisant chaque valeur de deux colonnes.
Multiplier Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes.
Soustraire Soustraie un nombre décimal positif ou négatif à chaque valeur de la colonne.

Effectuer des calculs numériques sur les valeurs de trois colonnes ou plus

Cloud Data Fusion permet d'effectuer des calculs numériques sur les valeurs de trois colonnes ou plus à partir de la version 6.8.0.

Pour appliquer un calcul numérique à trois colonnes ou plus, procédez comme suit:

  1. Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
  2. Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
  3. Accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
  4. Sélectionnez Calculer, puis une option (par exemple, Ajouter).
  5. Facultatif: Pour créer une colonne pour les valeurs calculées, cochez la case Copier dans une nouvelle colonne. Sinon, les valeurs calculées remplacent les valeurs existantes.
  6. Cliquez sur Appliquer.

Les valeurs changent en fonction du calcul. Wrangler ajoute la directive correspondante en tant qu'étape de la recette. Par exemple, si vous ajoutez les valeurs de chaque ligne des colonnes Q1_Sales, Q2_Sales, Q3_Sales et Q4_Sales, et que vous créez une nouvelle colonne appelée 2022_Sales, Wrangler ajoute la transformation suivante à la recette:

set-column :2022_Sales arithmetic:add(Q1_Sales, Q2_Sales, Q3_Sales, Q4_Sales)

Lorsque vous exécutez le pipeline de données, Wrangler effectue la transformation et crée une nouvelle colonne appelée 2022_Sales avec le total de Q1_Sales, Q2_Sales, Q3_Sales et Q4_Sales.

Calculs compatibles dans trois colonnes ou plus

Vous pouvez effectuer les calculs suivants sur les valeurs de chaque ligne dans trois colonnes ou plus:

Fonction Description
Ajouter Ajoute un nombre décimal positif ou négatif à une colonne ou plusieurs colonnes pour afficher la somme de chaque ligne.
Moyenne Renvoie la moyenne de chaque ligne de plusieurs colonnes.
Égal à Fonction booléenne qui compare deux colonnes pour voir si les valeurs correspondent, ligne par ligne. Renvoie true ou false.
Max Renvoie la valeur maximale pour chaque ligne dans deux colonnes.
Min Renvoie la valeur minimale pour chaque ligne de deux colonnes.
Multiplier Multiplie chaque valeur de la colonne par un nombre décimal positif ou négatif, ou multiplie chaque valeur de deux colonnes.

Étape suivante