Cette page explique comment séparer les données d'un champ (une cellule) en plusieurs lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion dans Google Marketing Platform Studio.
Séparer le texte délimité
Vous pouvez séparer les valeurs d'une cellule en nouvelles lignes si elles sont séparées par les délimiteurs suivants :
- Virgule
- Tabulation
- Barre verticale
- Espace blanc
- Séparateur personnalisé
Si une cellule ne contient pas le délimiteur choisi, aucune nouvelle ligne n'est insérée.
Pour diviser des valeurs en fonction d'un séparateur, procédez comme suit :
- Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
- Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
- Cliquez sur Éclairer > Texte délimité.
- Choisissez un délimiteur, par exemple Barre oblique.
Cliquez sur Extraire.
Wrangler divise les champs en fonction du délimiteur sélectionné et ajoute le
split-to-row
à la recette. Lorsque vous exécutez le pipeline de données,
Cloud Data Fusion applique la transformation à toutes les valeurs de la colonne.
Dans cet exemple, un ensemble de données comporte une colonne de valeurs de chaîne contenant le séparateur de virgule :
ID | Nom |
---|---|
1 | Lee,Lucien,Luka |
2 | Mahan,Noam |
Pour diviser la valeur en lignes distinctes, Wrangler supprime la colonne d'origine et crée une nouvelle colonne avec une ligne pour chaque valeur. Les autres valeurs de colonne de la ligne d'origine sont copiées dans les nouvelles lignes :
ID | Name_1 |
---|---|
1 | Lee |
1 | Lucian |
1 | Luka |
2 | Mahan |
2 | Noam |
Tableaux distincts
L'instruction flatten
sépare les éléments des tableaux, tels que ["ELEMENT_1",
"ELEMENT_2", "ELEMENT_3"]
, dans de nouvelles lignes. Les autres valeurs de colonne
l'enregistrement d'origine sont copiés
dans les nouveaux enregistrements.
Étape suivante
- En savoir plus sur les directives Wrangler