In questa pagina viene spiegato come separare i dati di un campo (una cella) in più di righe durante la preparazione dei dati nell'area di lavoro Wrangler di Cloud Data Fusion Studio.
Testo delimitato separato
Puoi separare i valori di una cella in nuove righe se sono separati dai seguenti delimitatori:
- Virgola
- TAB
- Barra verticale
- Spazio vuoto
- Separatore personalizzato
Se una cella non contiene il delimitatore scelto, non viene inserita alcuna nuova riga.
Per suddividere i valori in base a un delimitatore, segui questi passaggi:
- Vai all'area di lavoro di Wrangler in Cloud Data Fusion.
- Nella scheda Dati, vai al nome di una colonna e fai clic sull'icona arrow_drop_down freccia di espansione.
- Fai clic su Dividi > Testo delimitato.
- Scegli un delimitatore, ad esempio Virgola.
Fai clic su Estrai.
Wrangler divide i campi in base al delimitatore selezionato e aggiunge il valore
split-to-row
alla ricetta. Quando esegui la pipeline di dati,
Cloud Data Fusion applica la trasformazione a tutti i valori nella colonna.
In questo esempio, un set di dati ha una colonna di valori di stringa contenente il delimitatore virgole:
ID | Nome |
---|---|
1 | Lee, Lucian, Luka |
2 | Mahan, Noam |
Per suddividere il valore in righe separate, Wrangler elimina la colonna originale e crea una nuova colonna con una riga per ogni valore. Gli altri valori delle colonne della riga originale vengono copiati nelle nuove righe:
ID | Name_1 |
---|---|
1 | Lee |
1 | Lucian |
1 | Luka |
2 | Mahan |
2 | Noam |
Array separati
L'istruzione flatten
separa gli elementi di array, ad esempio ["ELEMENT_1",
"ELEMENT_2", "ELEMENT_3"]
, in nuove righe. Gli altri valori di colonna del
record originale vengono copiati nei nuovi record.
Passaggi successivi
- Scopri di più sulle istruzioni di Wrangler.