En esta página se explica cómo filtrar datos al prepararlos en el espacio de trabajo Wrangler de Cloud Data Fusion Studio. En Wrangler, puede filtrar filas de datos en columnas de cualquier tipo de datos, excepto el booleano. Puedes conservar o quitar filas en función de una condición que configures.
Para conservar o quitar filas en función de una condición, sigue estos pasos:
- Ve al espacio de trabajo de Wrangler en Cloud Data Fusion.
- En la pestaña Datos, vaya al nombre de una columna y haga clic en la flecha de expansión arrow_drop_down.
- Selecciona Filtrar y elige una opción, como Conservar filas y Si el valor contiene.
- Especifica la condición.
- Haz clic en Aplicar.
Los valores cambian en función del filtro. Wrangler añade la directiva filter-rows-on
a la receta. Cuando ejecutas la canalización de datos, la transformación se aplica a los valores de la columna.
Mantener filas
Si decides conservar las filas en función de una condición, se eliminarán las filas que no cumplan la condición. Solo permanecen en el conjunto de datos las filas que cumplen la condición. Por ejemplo, si selecciona el valor es e introduce la condición
Customer
, Wrangler conserva las filas que contienen la cadena Customer
y elimina las filas con otros valores.
Quitar filas
Si decide eliminar filas en función de una condición, las filas que cumplan la condición se eliminarán del conjunto de datos. Por ejemplo, si quitas filas y seleccionas el valor está vacío, Wrangler elimina las filas de la columna que tienen valores vacíos o nulos.
Condiciones de filtro admitidas
Puede filtrar las filas en función de las siguientes condiciones:
Condición | Descripción |
---|---|
El valor está vacío | Mantiene o quita los valores vacíos. |
value is | Mantiene o elimina los valores que coinciden exactamente con el valor especificado. En las columnas que contienen el tipo de datos de cadena, puede ignorar las mayúsculas y minúsculas. El valor predeterminado es incluir las mayúsculas y minúsculas en la condición. |
El valor contiene | Mantiene o quita los valores que contienen el valor especificado. |
El valor empieza por | Mantiene o elimina los valores que empiezan por el valor especificado. |
El valor termina con | Mantiene o elimina los valores que terminan con el valor especificado. |
Coincide con la regex | Mantiene o quita los valores que coinciden con la expresión regular. |
condición personalizada | Mantiene o elimina los valores que coinciden con la condición personalizada. |