Filtra dati

Questa pagina spiega come filtrare quando prepari i dati in Wrangler di Cloud Data Fusion Studio. In Wrangler, puoi filtrare righe di in colonne di qualsiasi tipo, tranne il tipo booleano. Mantieni o rimuovi in base a una condizione che hai configurato.

Per mantenere o rimuovere le righe in base a una condizione:

  1. Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, vai a un nome di colonna e fai clic sulla freccia di espansione arrow_drop_down.
  3. Seleziona Filtra e scegli un'opzione, ad esempio Mantieni righe e Se valore contiene.
  4. Specifica la condizione.
  5. Fai clic su Applica.

I valori cambiano in base al filtro. Wrangler aggiunge la direttiva filter-rows-on alla ricetta. Quando esegui la pipeline di dati, la trasformazione viene applicata ai valori della colonna.

Conserva righe

Se scegli di mantenere le righe in base a una condizione, le righe che non soddisfano vengono rimosse. Solo le righe che soddisfano la condizione rimangono nella del set di dati. Ad esempio, se selezioni il valore è e inserisci la condizione Customer, Wrangler conserva le righe contenenti la stringa Customer e rimuove righe con altri valori.

Rimuovere righe

Se scegli di rimuovere le righe in base a una condizione, le righe che soddisfano la condizione vengono rimosse dal set di dati. Ad esempio, se rimuovi le righe e selezioni value è vuoto, Wrangler rimuove dalla colonna le righe vuote o nulle e i relativi valori.

Condizioni di filtro supportate

Puoi filtrare le righe in base alle seguenti condizioni:

Condizione Descrizione
value è vuoto Mantiene o rimuove i valori con valori vuoti.
value è Mantiene o rimuove i valori con il valore esatto specificato. Per le colonne contenenti il tipo di dati stringa, puoi scegliere di ignorare la maiuscola. Per impostazione predefinita, viene inclusa la sensibilità alle maiuscole nella condizione.
value contains Conserva o rimuove i valori che contengono il valore specificato.
Il valore inizia con Mantiene o rimuove i valori che iniziano con il valore specificato.
Il valore termina con Conserva o rimuove i valori che terminano con il valore specificato.
corrisponde all'espressione regolare Conserva o rimuove i valori che corrispondono all'espressione regolare.
condizione personalizzata Conserva o rimuove i valori che corrispondono alla condizione personalizzata.

Passaggi successivi