Esta página explica como filtrar ao preparar dados no espaço de trabalho do Wrangler do Cloud Data Fusion Studio. No Wrangler, é possível filtrar linhas de dados em colunas de qualquer tipo, exceto o booleano. Você mantém ou remove com base em uma condição que você configurar.
Para manter ou remover linhas com base em uma condição, siga estas etapas:
- Acesse o espaço de trabalho do Wrangler no Cloud Data Fusion.
- Na guia Dados, acesse o nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Filtrar e escolha uma opção. Por exemplo, Manter linhas e Se o valor contiver.
- Especifique a condição.
- Clique em Aplicar.
Os valores mudam com base no filtro. O Wrangler adiciona o filter-rows-on
.
diretiva para o roteiro. Quando você executa o pipeline de dados, a transformação é
aplicada aos valores na coluna.
Manter linhas
Se você optar por manter as linhas com base em uma condição, aquelas que não atenderem ao
são removidas. Somente as linhas que atendem à condição permanecem no
no conjunto de dados. Por exemplo, se você selecionar value is e inserir a condição
Customer
, o Wrangler vai manter as linhas que contêm a string Customer
e remover
as linhas com outros valores.
Remover linhas
Se você optar por remover linhas com base em uma condição, as linhas que atenderem a ela são removidos do conjunto de dados. Por exemplo, se você remover linhas e selecionar valor está vazia, o Wrangler remove as linhas da coluna que têm valores vazios ou nulos valores.
Condições de filtro compatíveis
É possível filtrar linhas com base nas seguintes condições:
Condição | Descrição |
---|---|
o valor está vazio | Mantém ou remove valores com valores vazios. |
o valor é | Mantém ou remove valores com o valor especificado. Para colunas que contêm o tipo de dados de string, é possível ignorar o caso das letras. O padrão é incluir a caixa na condição. |
value contains | Mantém ou remove valores que contêm o valor especificado. |
o valor começa com | Mantém ou remove valores que começam com o valor especificado. |
valor termina com | Mantém ou remove valores que terminam com o valor especificado. |
corresponde à regex | Mantém ou remove valores que correspondem à expressão regular. |
condição personalizada | Mantém ou remove os valores que correspondem à condição personalizada. |
A seguir
- Saiba mais sobre as diretivas do Wrangler.