Cette page explique comment joindre des valeurs de colonne et échanger des noms de colonnes lorsque vous préparer des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio ;
Joindre deux colonnes
L'espace de travail Wrangler permet de joindre deux colonnes de même valeur ou de
types de données. Le résultat de l'opération JOIN
est stocké dans une nouvelle colonne contenant les champs joints des deux colonnes. Wrangler n'est pas compatible avec la jointure de colonnes de types de données booléens et d'octets avec d'autres colonnes.
Pour joindre deux colonnes, procédez comme suit:
- Accéder à l'espace de travail Wrangler dans Cloud Data Fusion
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Cliquez sur l'icône arrow_drop_down flèche de développement de l'un des noms de colonne.
- Sélectionnez Joindre deux colonnes, puis choisissez une option, par exemple Personnalisée sélection.
- Choisissez un ordre, un délimiteur et un nouveau nom de colonne pour l'opération
JOIN
de sortie. - Cliquez sur Participer.
Wrangler joint les colonnes et ajoute la directive merge
à la recette. Quand ?
lorsque vous exécutez le pipeline de données, la transformation est appliquée à toutes les valeurs
.
Intervertir les noms de deux colonnes
L'espace de travail Wrangler permet d'échanger deux noms de colonnes. Seuls les noms des colonnes s'échangent. Les valeurs des lignes des colonnes ne changent pas.
Pour échanger deux noms de colonnes, procédez comme suit :
- Accéder à l'espace de travail Wrangler dans Cloud Data Fusion
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Cliquez sur l'icône arrow_drop_down flèche de développement de l'un des noms de colonne.
- Sélectionnez Échanger deux noms de colonnes.
Wrangler échange les noms des colonnes et ajoute la directive swap
à la recette.
Étape suivante
- En savoir plus sur les directives Wrangler