En esta página, se explica cómo filtrar cuando preparas datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio. En Wrangler, puedes filtrar filas de datos en columnas de cualquier tipo de datos, excepto el tipo booleano. Puedes conservar o quitar filas según una condición que configures.
Para conservar o quitar filas según una condición, sigue estos pasos:
- Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
- Selecciona Filtrar y elige una opción, por ejemplo, Mantener filas y Si el valor contiene.
- Especifica la condición.
- Haz clic en Aplicar.
Los valores cambian según el filtro. Wrangler agrega la directiva filter-rows-on
a la receta. Cuando ejecutas el flujo de datos, la transformación se aplica a los valores de la columna.
Conservar filas
Si eliges conservar filas según una condición, se quitarán las filas que no cumplan con la condición. Solo las filas que cumplen con la condición permanecen en el conjunto de datos. Por ejemplo, si seleccionas valor es y, luego, ingresas la condición Customer
, Wrangler conserva las filas que contienen la cadena Customer
y quita las filas con otros valores.
Cómo quitar filas
Si eliges quitar filas según una condición, las filas que cumplan con la condición se quitarán del conjunto de datos. Por ejemplo, si quitas filas y seleccionas value is empty, Wrangler quitará las filas de la columna que tengan valores vacíos o nulos.
Condiciones de filtro compatibles
Puedes filtrar filas según las siguientes condiciones:
Condición | Descripción |
---|---|
value is empty | Conserva o quita los valores con valores vacíos. |
value is | Conserva o quita valores con el valor exacto especificado. En el caso de las columnas que contienen el tipo de datos de cadena, puedes ignorar el caso de las letras. La configuración predeterminada es incluir el caso en la condición. |
value contains | Conserva o quita los valores que contengan el valor especificado. |
value starts with | Conserva o quita los valores que comienzan con el valor especificado. |
El valor termina con | Conserva o quita los valores que terminan con el valor especificado. |
coincide con la regex | Conserva o quita los valores que coinciden con la expresión regular. |
condición personalizada | Conserva o quita los valores que coincidan con la condición personalizada. |
¿Qué sigue?
- Obtén más información sobre las directivas de Wrangler.