Exploder les données à partir de champs

Cette page explique comment séparer les données d'un champ (une cellule) en plusieurs lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion dans Google Marketing Platform Studio.

Séparer le texte délimité

Vous pouvez séparer les valeurs d'une cellule en nouvelles lignes si elles sont séparées par les délimiteurs suivants :

  • Virgule
  • Tabulation
  • Barre verticale
  • Espace blanc
  • Séparateur personnalisé

Si une cellule ne contient pas le délimiteur choisi, aucune nouvelle ligne n'est insérée.

Pour diviser des valeurs en fonction d'un séparateur, procédez comme suit :

  1. Accédez à l'espace de travail Wrangler dans Cloud Data Fusion.
  2. Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
  3. Cliquez sur Éclairer > Texte délimité.
  4. Choisissez un délimiteur, par exemple Barre oblique.
  5. Cliquez sur Extraire.

Wrangler divise les champs en fonction du délimiteur sélectionné et ajoute le split-to-row à la recette. Lorsque vous exécutez le pipeline de données, Cloud Data Fusion applique la transformation à toutes les valeurs de la colonne.

Dans cet exemple, un ensemble de données comporte une colonne de valeurs de chaîne contenant le séparateur de virgule :

ID Nom
1 Lee,Lucien,Luka
2 Mahan,Noam

Pour diviser la valeur en lignes distinctes, Wrangler supprime la colonne d'origine et crée une nouvelle colonne avec une ligne pour chaque valeur. Les autres valeurs de colonne de la ligne d'origine sont copiées dans les nouvelles lignes :

ID Name_1
1 Lee
1 Lucian
1 Luka
2 Mahan
2 Noam

Tableaux distincts

L'instruction flatten sépare les éléments des tableaux, tels que ["ELEMENT_1", "ELEMENT_2", "ELEMENT_3"], dans de nouvelles lignes. Les autres valeurs de colonne l'enregistrement d'origine sont copiés dans les nouveaux enregistrements.

Étape suivante