In questa pagina vengono descritte le istruzioni che puoi utilizzare in Wrangler.
In modalità di alimentazione di Wrangler (l'interfaccia a riga di comando di Wrangler), puoi aggiungere istruzioni e funzioni a una formula. Per maggiori informazioni, consulta le direttive dell'interfaccia a riga di comando di Wrangler e le funzioni di Wrangler.
Wrangler supporta le seguenti direttive:
Operazioni sulle colonne
Direttiva | Descrizione |
---|---|
Cambia maiuscole e minuscole nelle colonne | Modifica i nomi delle colonne in lettere minuscole o maiuscole. |
Cambio della richiesta | Modifica le maiuscole e le minuscole dei valori delle colonne. |
Pulisci i nomi delle colonne | Sanitizza i nomi delle colonne, seguendo regole specifiche. |
Colonne Sostituisci | Modifica collettivamente i nomi delle colonne. |
Copy | Copia i valori da una colonna di origine in una colonna di destinazione. |
Rilascia colonna | Elimina una colonna in un record. |
Riempi null o vuoto | Se il valore è nullo o vuoto, inserisce un valore di colonna fisso. |
Keep | Mantiene le colonne specificate del record. |
Unisci | Unisce due colonne inserendo una terza colonna. |
Rinomina | Rinomina una colonna esistente nel record. |
Imposta intestazioni | Imposta i nomi delle colonne, nell'ordine in cui sono specificati. |
Suddividi in colonne | Divide una colonna in più colonne in base a un separatore. |
Scambia | Scambia i nomi delle colonne di due colonne. |
Tipo di impostazione | Converte il tipo di dati di una colonna. |
Trasformazioni delle date
Direttiva | Descrizione |
---|---|
Data diff | Calcola la differenza tra due date. |
Formato Data | Pattern personalizzati per la formattazione di data e ora. |
Formato timestamp UNIX | Formatta un timestamp UNIX come data. |
Trasformazioni data/ora
Direttiva | Descrizione |
---|---|
Data/ora attuale | Genera la data/ora corrente con un determinato fuso orario. |
Da data a timestamp | Crea un timestamp a partire da data/ora e fuso orario specificato. |
Formato Data/ora | Formatta come data/ora una stringa di un determinato formato. |
Da timestamp a Datetime | Converte un timestamp in data/ora. |
Codificatori e decoder
Direttiva | Descrizione |
---|---|
Decodifica | Decodifica un valore di colonna come uno tra base32 ,
base64 o hex. |
Codifica | Codifica un valore di colonna come uno tra base32 , base64 o hex. |
Hashing e mascheramento
Direttiva | Descrizione |
---|---|
Hash | Genera un digest del messaggio. |
Numero maschera | Applica il mascheramento di sostituzione ai valori della colonna. |
Mask Shuffle | Applica il mascheramento shuffling ai valori della colonna. |
Ricerche
Direttiva | Descrizione |
---|---|
Ricerca del catalogo | Ricerca statica nel catalogo dei codici ICD-9, ICD-10-2016 e ICD-10-2017. |
Ricerca nella tabella | Esegue ricerche nei set di dati delle tabelle. |
Elaborazione del linguaggio naturale
Direttiva | Descrizione |
---|---|
Parole con radice tokenizzata | Applica l'algoritmo di derivazione di Porter per le parole inglesi. |
Formattatori di output
Direttiva | Descrizione |
---|---|
Scrivi come CSV | Converte un record in formato CSV. |
Scrivi come mappa JSON | Converte il record in una mappa JSON. |
Scrivi oggetto JSON | Crea un oggetto JSON in base ai campi specificati. |
Formatta come valuta | Formatta un numero nella valuta specificata dalle impostazioni internazionali. |
Parser
Direttiva | Descrizione |
---|---|
Percorso JSON | Utilizza un DSL (un'espressione di percorso JSON) per analizzare i record JSON. |
Analizza come file AVRO | Analizza un file di dati AVRO. |
Analizza come CSV | Analizza un record di input come valori separati da virgole |
Analizza come valuta | Analizza un valore di valuta che è una rappresentazione stringa della valuta locale in un numero. |
Analizza come Data/ora | Analizza la stringa come tipo di dati data/ora con un determinato formato. |
Analizza come Excel | Analizza in un file di Microsoft Excel. |
Analizza come lunghezza fissa | Analizza come record a lunghezza fissa con larghezze specificate. |
Analizza come HL7 | Analizza i messaggi di Health Level 7 Version 2 (HL7 V2). |
Analizza come JSON | Analizza un oggetto JSON. |
Analizza come log | Analizza i file di log degli accessi, come i server Apache httpd e NGINX. |
Analizza come data semplice | Analizza le stringhe delle date. |
Analizza come timestamp | Analizza i valori delle colonne che rappresentano il timestamp Unix come data. |
Analizzare il codice XML in JSON | Analizza un documento XML in una struttura JSON. |
Operazioni riga
Direttiva | Descrizione |
---|---|
Filtra righe | Filtra i record in base a una condizione. |
Filtra riga se corrispondente | Filtra le righe che corrispondono a un pattern per una colonna. |
Appiattisci | Separa gli elementi in un campo ripetuto. |
Errore a condizione | L'elaborazione non riesce quando la condizione viene valutata su true. |
Invia a errore | Filtra i record in base a un raccoglitore errori. |
Invia all'errore e continua l'elaborazione | Filtra i record in base a un raccoglitore errori e continua l'elaborazione. |
Dividi in righe | Suddivide in più record in base a un separatore. |
Trasformazioni
Direttiva | Descrizione |
---|---|
Cambio della richiesta | Modifica le maiuscole e le minuscole dei valori delle colonne in caratteri maiuscoli o minuscoli. |
Crea record | Crea una colonna di record con valori nidificati copiando i valori dalle colonne di origine in una colonna di destinazione. |
Taglia carattere | Seleziona parti di un valore stringa. |
Imposta colonna | Imposta il valore della colonna sul risultato dell'esecuzione di un'espressione. |
Trova e sostituisci | Trasforma i valori delle colonne di tipo stringa utilizzando un'espressione simile a "sed". |
Quantizzazione | Applica la quantizzazione ai valori delle colonne. |
Estrai gruppi di regex | Estrae i dati da un gruppo di espressioni regolari in una propria colonna. |
Imposta set di caratteri | Imposta la codifica, quindi converte i dati in una stringa UTF-8. |
Imposta record Delim | Imposta il delimitatore del record. |
Email divisa | Suddivide un ID email in un account e nel rispettivo dominio. |
Suddividi URL | Suddivide un URL nei suoi componenti. |
Distanza testo (corrispondenza stringa fuzzy) | Misura la differenza tra due sequenze di caratteri. |
Metrica di testo (Corrispondenza stringa fuzzy) | Misura la differenza tra due sequenze di caratteri. |
Decodifica URL | Decodifica dal formato MIME application/x-www-form-urlencoded . |
Codifica URL | Codifica nel formato MIME application/x-www-form-urlencoded . |
Taglio degli spazi | Funzioni per tagliare gli spazi bianchi intorno ai dati stringa. |
Aggregatori e setter temporanei
Direttiva | Descrizione |
---|---|
Incrementa variabile | Incrementa una variabile transitoria con un record di elaborazione. |
Imposta variabile | Imposta una variabile transitoria con un record di elaborazione. |
ID univoco
Direttiva | Descrizione |
---|---|
Genera UUID | Genera un UUID (Universally Unique Identifier). |
Passaggi successivi
- Scopri di più sulle funzioni di Wrangler.