Espandere i dati dai campi

In questa pagina viene spiegato come separare i dati di un campo (una cella) in più di righe durante la preparazione dei dati nell'area di lavoro Wrangler di Cloud Data Fusion Studio.

Testo delimitato separato

Puoi separare i valori di una cella in nuove righe se sono separati dai seguenti delimitatori:

  • Virgola
  • TAB
  • Barra verticale
  • Spazio vuoto
  • Separatore personalizzato

Se una cella non contiene il delimitatore scelto, non viene inserita alcuna nuova riga.

Per suddividere i valori in base a un delimitatore, segui questi passaggi:

  1. Vai all'area di lavoro di Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, vai al nome di una colonna e fai clic sull'icona arrow_drop_down freccia di espansione.
  3. Fai clic su Dividi > Testo delimitato.
  4. Scegli un delimitatore, ad esempio Virgola.
  5. Fai clic su Estrai.

Wrangler divide i campi in base al delimitatore selezionato e aggiunge il valore split-to-row alla ricetta. Quando esegui la pipeline di dati, Cloud Data Fusion applica la trasformazione a tutti i valori nella colonna.

In questo esempio, un set di dati ha una colonna di valori di stringa contenente il delimitatore virgole:

ID Nome
1 Lee, Lucian, Luka
2 Mahan, Noam

Per suddividere il valore in righe separate, Wrangler elimina la colonna originale e crea una nuova colonna con una riga per ogni valore. Gli altri valori delle colonne della riga originale vengono copiati nelle nuove righe:

ID Name_1
1 Lee
1 Lucian
1 Luka
2 Mahan
2 Noam

Array separati

L'istruzione flatten separa gli elementi di array, ad esempio ["ELEMENT_1", "ELEMENT_2", "ELEMENT_3"], in nuove righe. Gli altri valori di colonna del record originale vengono copiati nei nuovi record.

Passaggi successivi