Filtrar datos

En esta página se explica cómo filtrar datos al prepararlos en el espacio de trabajo Wrangler de Cloud Data Fusion Studio. En Wrangler, puede filtrar filas de datos en columnas de cualquier tipo de datos, excepto el booleano. Puedes conservar o quitar filas en función de una condición que configures.

Para conservar o quitar filas en función de una condición, sigue estos pasos:

  1. Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, vaya al nombre de una columna y haga clic en la flecha de expansión arrow_drop_down.
  3. Selecciona Filtrar y elige una opción, como Conservar filas y Si el valor contiene.
  4. Especifica la condición.
  5. Haz clic en Aplicar.

Los valores cambian en función del filtro. Wrangler añade la directiva filter-rows-on a la receta. Cuando ejecutas la canalización de datos, la transformación se aplica a los valores de la columna.

Mantener filas

Si decides conservar las filas en función de una condición, se eliminarán las filas que no cumplan la condición. Solo permanecen en el conjunto de datos las filas que cumplen la condición. Por ejemplo, si selecciona el valor es e introduce la condición Customer, Wrangler conserva las filas que contienen la cadena Customer y elimina las filas con otros valores.

Quitar filas

Si decide eliminar filas en función de una condición, las filas que cumplan la condición se eliminarán del conjunto de datos. Por ejemplo, si quitas filas y seleccionas el valor está vacío, Wrangler elimina las filas de la columna que tienen valores vacíos o nulos.

Condiciones de filtro admitidas

Puede filtrar las filas en función de las siguientes condiciones:

Condición Descripción
El valor está vacío Mantiene o quita los valores vacíos.
value is Mantiene o elimina los valores que coinciden exactamente con el valor especificado. En las columnas que contienen el tipo de datos de cadena, puede ignorar las mayúsculas y minúsculas. El valor predeterminado es incluir las mayúsculas y minúsculas en la condición.
El valor contiene Mantiene o quita los valores que contienen el valor especificado.
El valor empieza por Mantiene o elimina los valores que empiezan por el valor especificado.
El valor termina con Mantiene o elimina los valores que terminan con el valor especificado.
Coincide con la regex Mantiene o quita los valores que coinciden con la expresión regular.
condición personalizada Mantiene o elimina los valores que coinciden con la condición personalizada.

Siguientes pasos