Filtra dati

Questa pagina spiega come applicare i filtri durante la preparazione dei dati nello spazio di lavoro Wrangler di Studio di Cloud Data Fusion. In Wrangler, puoi filtrare le righe di dati nelle colonne di qualsiasi tipo di dati, ad eccezione del tipo booleano. Mantieni o rimuovi le righe in base a una condizione configurata.

Per mantenere o rimuovere le righe in base a una condizione:

  1. Vai allo spazio di lavoro Wrangler in Cloud Data Fusion.
  2. Nella scheda Dati, vai a un nome di colonna e fai clic sulla freccia di espansione arrow_drop_down.
  3. Seleziona Filtra e scegli un'opzione, ad esempio Mantieni righe e Se valore contiene.
  4. Specifica la condizione.
  5. Fai clic su Applica.

I valori cambiano in base al filtro. Wrangler aggiunge la direttiva filter-rows-on alla ricetta. Quando esegui la pipeline di dati, la trasformazione viene applicata ai valori della colonna.

Conserva righe

Se scegli di conservare le righe in base a una condizione, le righe che non soddisfano la condizione vengono rimosse. Nel set di dati rimangono solo le righe che soddisfano la condizione. Ad esempio, se selezioni value is (il valore è) e inserisci la condizioneCustomer, Wrangler conserva le righe contenenti la stringa Customer e rimuove le righe con altri valori.

Rimuovere righe

Se scegli di rimuovere le righe in base a una condizione, le righe che soddisfano la condizione vengono rimosse dal set di dati. Ad esempio, se rimuovi le righe e selezioni Il valore è vuoto, Wrangler rimuove dalla colonna le righe con valori vuoti o null.

Condizioni di filtro supportate

Puoi filtrare le righe in base alle seguenti condizioni:

Condizione Descrizione
value è vuoto Mantiene o rimuove i valori con valori vuoti.
value è Mantiene o rimuove i valori con il valore esatto specificato. Per le colonne contenenti il tipo di dati stringa, puoi scegliere di ignorare la maiuscola. Per impostazione predefinita, viene inclusa la sensibilità alle maiuscole nella condizione.
value contains Mantiene o rimuove i valori che contengono il valore specificato.
Il valore inizia con Mantiene o rimuove i valori che iniziano con il valore specificato.
Il valore termina con Mantiene o rimuove i valori che terminano con il valore specificato.
corrisponde a regex Mantiene o rimuove i valori che corrispondono all'espressione regolare.
condizione personalizzata Mantiene o rimuove i valori corrispondenti alla condizione personalizzata.

Passaggi successivi