En esta página, se describen las directivas que puedes usar en Wrangler.
En el modo Power de Wrangler (la CLI de Wrangler), puedes agregar directivas y funciones a una receta. Para obtener más información, consulta Directivas de la CLI de Wrangler y Funciones de Wrangler.
Wrangler admite las siguientes directivas:
Operaciones de la columna
Directiva | Descripción |
---|---|
Cambiar Uso de mayúsculas y minúsculas de la columna | Cambia los nombres de las columnas a mayúsculas o minúsculas. |
Cambio de mayúsculas y minúsculas | Cambia la mayúscula o minúscula de los valores de la columna. |
Limpieza Nombres de columnas | Limpia los nombres de las columnas según reglas específicas. |
Columnas Reemplazar | Modifica los nombres de las columnas de forma masiva. |
Copy | Copia valores de una columna de origen en una columna de destino. |
Quitar Columna | Quita una columna en un registro. |
Rellenar nulo o vacío | Si el valor es nulo o vacío, ingresa un valor de columna fijo. |
Mantener | Mantiene las columnas especificadas del registro. |
Combinar | Combina dos columnas insertando una tercera. |
Cambiar nombre | Cambia el nombre de una columna existente en el registro. |
Establecer Encabezados | Establece los nombres de las columnas, en el orden en que se especifican. |
Dividir en Columnas | Divide una columna en varias en función de un separador. |
Cambiar | Intercambia los nombres de dos columnas. |
Tipo de set | Convierte el tipo de datos de una columna. |
Transformaciones de fecha
Directiva | Descripción |
---|---|
Fecha de la | Calcula la diferencia entre dos fechas. |
Formato Fecha | Patrones personalizados para el formato de fecha y hora. |
Formato de marca de tiempo de | Da formato a una marca de tiempo UNIX como una fecha. |
Transformaciones de fecha y hora
Directiva | Descripción |
---|---|
Actual Fecha y hora | Genera la fecha y hora actuales con una zona horaria determinada. |
De fecha y hora a Marca de tiempo | Crea una marca de tiempo a partir de una fecha y hora determinadas y una zona horaria. |
Formato Fecha y hora | Da formato a la fecha y hora en una cadena de un formato determinado. |
De marca de tiempo a fecha y hora | Convierte una marca de tiempo en una fecha y hora. |
Codificadores y decodificadores
Directiva | Descripción |
---|---|
Decodificar | Decodifica un valor de columna como uno de base32 .
base64 o hex. |
Codificación | Codifica un valor de columna como uno de base32 .
base64 o hex. |
Hash y enmascaramiento
Directiva | Descripción |
---|---|
Hash | Genera un resumen del mensaje. |
Número de máscara | Aplica el enmascaramiento de sustitución a los valores de la columna. |
Mask Shuffle | Aplica el enmascaramiento aleatorio en los valores de la columna. |
Búsquedas
Directiva | Descripción |
---|---|
Búsqueda de catálogo | Búsqueda de catálogo estático de códigos ICD-9, ICD-10-2016 y ICD-10-2017 |
Búsqueda de tablas | Realiza búsquedas en conjuntos de datos de tablas. |
Procesamiento de lenguaje natural
Directiva | Descripción |
---|---|
Desinencia de las palabras con asignación de token | Aplica el algoritmo de stemming de Porter para palabras en inglés. |
Formateadores de salida
Directiva | Descripción |
---|---|
Escribir como CSV | Convierte un registro a formato CSV. |
Escribir como Mapa JSON | Convierte el registro en un mapa JSON. |
Escribe JSON Objeto | Compone un objeto JSON según los campos especificados. |
Asignar formato de moneda | Establece el formato de un número como una moneda según la configuración regional. |
Analizadores
Directiva | Descripción |
---|---|
Ruta de JSON | Usa una DSL (una expresión de ruta de acceso JSON) para analizar registros JSON. |
Analizar como AVRO Archivo | Analiza un archivo de datos AVRO. |
Analizar como CSV | Analiza un registro de entrada como valores separados por comas. |
Analizar como Moneda | Analiza un valor de moneda que es una representación de cadena de la moneda local en un número. |
Analizar como fecha y hora | Analiza la cadena como un tipo de datos de fecha y hora con un formato determinado. |
Analizar como Excel | Se analiza en un archivo de Microsoft Excel. |
Analizar como longitud fija | Analiza como un registro de longitud fija con anchos especificados. |
Analizar como HL7 | Analiza los mensajes de Health Level 7 versión 2 (HL7 v2). |
Analizar como JSON | Analiza un objeto JSON. |
Analizar como registro | Analiza los archivos de registro de acceso, como los servidores Apache httpd y NGINX. |
Analizar como Fecha simple | Analiza cadenas de fecha. |
Analizar como marca de tiempo | Analiza los valores de columna que representan la marca de tiempo de Unix como fecha. |
Cómo analizar XML a JSON | Analiza un documento XML y lo convierte en una estructura JSON. |
Operaciones con filas
Directiva | Descripción |
---|---|
Filtro Filas | Filtra registros según una condición. |
Filtrar fila si hay coincidencias | Filtra las filas que coinciden con un patrón para una columna. |
Flatten | Separa los elementos en un campo repetido. |
Falló el condición | No se procesa cuando la condición se evalúa como verdadera. |
Error de la función Enviar a | Filtra registros en un recopilador de errores. |
Enviar a error y continuar con el procesamiento | Filtra los registros a un recopilador de errores y continúa con el procesamiento. |
Dividir en filas | Separa en varios registros en función de un separador. |
Transformaciones
Directiva | Descripción |
---|---|
Cambio de mayúsculas y minúsculas | Cambia las mayúsculas o minúsculas de los valores de columna a mayúsculas o minúsculas. caracteres. |
Crear registro | Crea una columna de registro con valores anidados copiando valores de columnas de origen en una columna de destino. |
Cortar Personaje | Selecciona partes de un valor de cadena. |
Establecer Columna | Establece el valor de la columna como el resultado de la ejecución de una expresión. |
Buscar y reemplazar | Transforma los valores de las columnas de cadena con una expresión similar a "sed". |
Cuantización | Aplica la cuantización a los valores de las columnas. |
Extraer Grupos de regex | Extrae los datos de un grupo de expresiones regulares y los convierte en sus propios datos. . |
Establecer Conjunto de caracteres | Establece la codificación y, luego, convierte los datos en una cadena UTF-8. |
Establecer grabación Delim | Establece el delimitador de registros. |
Dividir Correo electrónico | Divide un ID de correo electrónico en una cuenta y su dominio. |
URL dividida | Divide una URL en sus componentes. |
Texto Distancia (coincidencia de cadena parcial) | Mide la diferencia entre dos secuencias de caracteres. |
Métrica de texto (Coincidencia de cadena parcial) | Mide la diferencia entre dos secuencias de caracteres. |
URL Decodificación | Decodifica desde el formato MIME application/x-www-form-urlencoded . |
Codificación de URL | Codifica en el formato MIME application/x-www-form-urlencoded . |
Cómo recortar espacios | Funciones para cortar espacios en blanco alrededor de datos de cadena |
Agregadores y set de métodos transitorios
Directiva | Descripción |
---|---|
Incremento Variable | Incrementa una variable transitoria con un registro de procesamiento. |
Establecer Variable | Establece una variable transitoria con un registro de procesamiento. |
ID único
Directiva | Descripción |
---|---|
Generar UUID | Genera un identificador único universal (UUID). |
¿Qué sigue?
- Obtén más información sobre las funciones de Wrangler.