Esta página explica como filtrar quando prepara dados no espaço de trabalho do Wrangler do Cloud Data Fusion Studio. No Wrangler, pode filtrar linhas de dados em colunas de qualquer tipo de dados, exceto o tipo booleano. Mantém ou remove linhas com base numa condição que configurar.
Para manter ou remover linhas com base numa condição, siga estes passos:
- Aceda ao espaço de trabalho do Wrangler no Cloud Data Fusion.
- No separador Dados, aceda ao nome de uma coluna e clique na seta de expansão arrow_drop_down.
- Selecione Filtrar e selecione uma opção, por exemplo, Manter linhas e Se o valor contiver.
- Especifique a condição.
- Clique em Aplicar.
Os valores mudam com base no filtro. O Wrangler adiciona a diretiva filter-rows-on
à receita. Quando executa o pipeline de dados, a transformação é aplicada aos valores na coluna.
Manter linhas
Se optar por manter linhas com base numa condição, as linhas que não cumprem a condição são removidas. Apenas as linhas que cumprem a condição permanecem no conjunto de dados. Por exemplo, se selecionar o valor é e introduzir a condição
Customer
, o Wrangler mantém as linhas que contêm a string Customer
e remove as linhas com outros valores.
Remova linhas
Se optar por remover linhas com base numa condição, as linhas que cumprem a condição são removidas do conjunto de dados. Por exemplo, se remover linhas e selecionar o valor está vazio, o Wrangler remove as linhas da coluna que têm valores vazios ou nulos.
Condições de filtro suportadas
Pode filtrar linhas com base nas seguintes condições:
Condição | Descrição |
---|---|
O valor está vazio | Mantém ou remove valores com valores vazios. |
O valor é | Mantém ou remove valores com o valor especificado exato. Para colunas que contêm o tipo de dados de string, pode optar por ignorar a capitalização. A predefinição é incluir a capitalização na condição. |
O valor contém | Mantém ou remove valores que contêm o valor especificado. |
O valor começa com | Mantém ou remove valores que começam com o valor especificado. |
O valor termina com | Mantém ou remove valores que terminam com o valor especificado. |
corresponde à regex | Mantém ou remove valores que correspondem à expressão regular. |
condição personalizada | Mantém ou remove valores que correspondem à condição personalizada. |
O que se segue?
- Saiba mais acerca das diretivas do Wrangler.