Cette page explique comment joindre des valeurs de colonne et échanger des noms de colonne lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.
Joindre deux colonnes
L'espace de travail Wrangler permet de joindre deux colonnes de types de données identiques ou différents. Le résultat de l'opération JOIN
est stocké dans une nouvelle colonne contenant les champs joints des deux colonnes. Wrangler n'est pas compatible avec la jointure de colonnes de types de données booléens et d'octets avec d'autres colonnes.
Pour joindre deux colonnes, procédez comme suit:
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Cliquez sur la flèche d'expansion arrow_drop_down à côté de l'un des noms de colonne.
- Sélectionnez Joindre deux colonnes, puis une option (par exemple, Sélection personnalisée).
- Choisissez un ordre, un séparateur et un nouveau nom de colonne pour la sortie de l'opération
JOIN
. - Cliquez sur Rejoindre.
Wrangler joint les colonnes et ajoute la directive merge
à la recette. Lorsque vous exécutez le pipeline de données, la transformation est appliquée à toutes les valeurs de la colonne.
Échanger deux noms de colonnes
L'espace de travail Wrangler permet d'échanger deux noms de colonnes. Seuls les noms de colonnes sont interchangés, les valeurs des lignes de colonne ne changent pas.
Pour échanger deux noms de colonnes, procédez comme suit:
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, cochez la case à côté de deux noms de colonnes.
- Cliquez sur la flèche d'expansion arrow_drop_down à côté de l'un des noms de colonne.
- Sélectionnez Échanger deux noms de colonnes.
Wrangler échange les noms de colonnes et ajoute la directive swap
à la recette.
Étape suivante
- En savoir plus sur les directives Wrangler