Cómo filtrar datos

En esta página, se explica cómo filtrar cuando preparas datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio. En Wrangler, puedes filtrar filas de en columnas de cualquier tipo de datos, excepto el tipo booleano. Conservas o quitas filas según una condición que configures.

Para conservar o quitar filas según una condición, sigue estos pasos:

  1. Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
  2. En la pestaña Datos, ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
  3. Selecciona Filtrar y elige una opción, por ejemplo, Mantener filas y Si el valor contiene.
  4. Especifica la condición.
  5. Haz clic en Aplicar.

Los valores cambian según el filtro. Wrangler agrega el filter-rows-on directiva a la receta. Cuando ejecutas la canalización de datos, la transformación se se aplican a los valores de la columna.

Conservar filas

Si eliges conservar filas según una condición, se quitarán las filas que no la cumplan. Solo las filas que cumplen con la condición permanecen en el conjunto de datos. Por ejemplo, si seleccionas valor es y, luego, ingresas la condición Customer, Wrangler conserva las filas que contienen la cadena Customer y quita las filas con otros valores.

Quitar filas

Si eliges quitar filas según una condición, las filas que cumplan con la condición se quitarán del conjunto de datos. Por ejemplo, si quitas filas y seleccionas value is empty, Wrangler quitará las filas de la columna que tengan valores vacíos o nulos.

Condiciones de filtro compatibles

Puedes filtrar filas según las siguientes condiciones:

Condición Descripción
value is empty Conserva o quita los valores con valores vacíos.
el valor es Conserva o quita los valores con el valor exacto especificado. En el caso de las columnas que contienen el tipo de datos de cadena, puedes ignorar el caso de las letras. El es incluir mayúsculas y minúsculas en la condición.
value contiene Conserva o quita los valores que contengan el valor especificado.
value starts with Conserva o quita los valores que comienzan con el valor especificado.
value ends with Conserva o quita los valores que terminan con el valor especificado.
coincide con la regex Conserva o quita los valores que coinciden con la expresión regular.
condición personalizada Conserva o quita los valores que coinciden con la condición personalizada.

¿Qué sigue?