Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Cette page explique comment séparer les données d'un champ (une cellule) en plusieurs lignes lorsque vous préparez des données dans l'espace de travail Wrangler de Cloud Data Fusion Studio.
Séparer le texte délimité
Vous pouvez séparer les valeurs d'une cellule en nouvelles lignes si elles sont séparées par les délimiteurs suivants:
Virgule
Tabulation
Barre verticale
Espace blanc
Séparateur personnalisé
Si une cellule ne contient pas le délimiteur choisi, aucune nouvelle ligne n'est insérée.
Pour diviser des valeurs en fonction d'un séparateur, procédez comme suit:
Dans l'onglet Données, accédez à un nom de colonne, puis cliquez sur la flèche d'expansion arrow_drop_down.
Cliquez sur Exploder > Texte délimité.
Choisissez un délimiteur, par exemple Barre oblique.
Cliquez sur Extraire.
Wrangler divise les champs en fonction du délimiteur sélectionné et ajoute la directive split-to-row à la recette. Lorsque vous exécutez le pipeline de données, Cloud Data Fusion applique la transformation à toutes les valeurs de la colonne.
Dans cet exemple, un ensemble de données comporte une colonne de valeurs de chaîne contenant le séparateur de virgule:
ID
Nom
1
Lee,Lucian,Luka
2
Mahan,Noam
Pour diviser la valeur en lignes distinctes, Wrangler supprime la colonne d'origine et crée une colonne avec une ligne pour chaque valeur. Les autres valeurs de colonne de la ligne d'origine sont copiées dans les nouvelles lignes:
ID
Nom_1
1
Lee
1
Lucian
1
Luka
2
Mahan
2
Noam
Tableaux distincts
La directive flatten sépare les éléments des tableaux, tels que ["ELEMENT_1",
"ELEMENT_2", "ELEMENT_3"], en nouvelles lignes. Les autres valeurs de colonne de l'enregistrement d'origine sont copiées dans les nouveaux enregistrements.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eThis guide outlines the process of separating data within a single cell into multiple rows using the Wrangler workspace in Cloud Data Fusion Studio.\u003c/p\u003e\n"],["\u003cp\u003eThe "Explode > Delimited text" feature allows users to split values within a cell into new rows based on delimiters such as commas, tabs, pipes, whitespace, or a custom separator defined with a regular expression.\u003c/p\u003e\n"],["\u003cp\u003eWhen splitting delimited text, if a cell does not contain the specified delimiter, no new row will be inserted, and the original column is deleted and replaced by a new one.\u003c/p\u003e\n"],["\u003cp\u003eThe "flatten" directive can be used to separate array items into new rows, while also copying the other column values from the original record into each new record.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003esplit-to-row\u003c/code\u003e directive is added to the recipe when using the delimited text feature, applying the transformation to all values in the column when the data pipeline runs.\u003c/p\u003e\n"]]],[],null,["# Explode data from fields\n\nThis page explains how to separate data from a field (a cell) into multiple\nrows when you prepare data in the Wrangler workspace of the Cloud Data Fusion\nStudio.\n\nSeparate delimited text\n-----------------------\n\nYou can separate the values from a cell into new rows if the values are\nseparated by the following delimiters:\n\n- Comma\n- Tab\n- Pipe\n- Whitespace\n- Custom separator\n\nIf a cell doesn't contain the chosen delimiter, no new row is inserted.\n\nTo split values based on a delimiter, follow these steps:\n\n1. [Go to Wrangler workspace in Cloud Data Fusion](/data-fusion/docs/concepts/wrangler-overview#navigate-to-wrangler).\n2. On the **Data** tab, go to a column name and click the arrow_drop_down expander arrow.\n3. Click **Explode \\\u003e Delimited text**.\n4. Choose a delimiter---for example **Pipe**.\n5. Click **Extract**.\n\n | **Note:** If you select Custom separator, define the delimiter with a regular expression.\n\nWrangler splits the fields based on the selected delimiter and adds the\n`split-to-row` directive to the recipe. When you run the data pipeline,\nCloud Data Fusion applies the transformation to all values in the column.\n\nIn this example, a dataset has a column of string values containing the comma\ndelimiter:\n\nTo divide the value into separate rows, Wrangler deletes the original column and\ncreates a new column with one row for each value. The other column values from\nthe original row are copied into the new rows:\n\nSeparate arrays\n---------------\n\nThe `flatten` directive separates items in arrays, such as `[\"ELEMENT_1\",\n\"ELEMENT_2\", \"ELEMENT_3\"]`, into new rows. The other column values from the\noriginal record are copied into the new records.\n\nWhat's next\n-----------\n\n- Learn more about [Wrangler directives](/data-fusion/docs/concepts/wrangler-overview#apply_directives)."]]