In questa pagina vengono descritte le istruzioni che puoi utilizzare in Wrangler.
In modalità Alimentazione di Wrangler (l'interfaccia a riga di comando di Wrangler), puoi aggiungere istruzioni e funzioni a una formula. Per ulteriori informazioni, vedi Direttive interfaccia a riga di comando di Wrangler e Funzioni di Wrangler.
Wrangler supporta le seguenti direttive:
Operazioni sulle colonne
Direttiva | Descrizione |
---|---|
Cambia Maiuscola colonna | Modifica i nomi delle colonne in lettere minuscole o maiuscole. |
Modifica in corso Custodia | Modifica le maiuscole e le minuscole dei valori delle colonne. |
Pulizia dei nomi delle colonne | Sanitizza i nomi delle colonne, seguendo regole specifiche. |
Colonne Sostituisci | Modifica collettivamente i nomi delle colonne. |
Copy | Copia i valori da una colonna di origine in una colonna di destinazione. |
Colonna inserisci | Consente di eliminare una colonna in un record. |
Riempi con valore Null o vuoto | Se il valore è null o vuoto, inserisci un valore di colonna fisso. |
Keep | Mantiene le colonne specificate del record. |
Unisci | Unisce due colonne inserendo una terza colonna. |
Rinomina | Rinomina una colonna esistente nel record. |
Imposta intestazioni | Imposta i nomi delle colonne nell'ordine in cui sono specificati. |
Dividi in colonne | Divide una colonna in più colonne in base a un separatore. |
Scambia | Scambia i nomi delle colonne di due colonne. |
Tipo di set | Converte il tipo di dati di una colonna. |
Trasformazioni delle date
Direttiva | Descrizione |
---|---|
Diff Date | Calcola la differenza tra due date. |
Formato Data | Pattern personalizzati per la formattazione di date e ore. |
Formatta il timestamp UNIX | Formatta un timestamp UNIX come data. |
Trasformazioni di date e ore
Direttiva | Descrizione |
---|---|
Data/ora corrente | Genera la data/ora corrente con un determinato fuso orario. |
Data e ora fino a Data e ora | Crea un timestamp da data e ora e da un fuso orario specificato. |
Formato Data/ora | Formatta la data/ora in una stringa di un determinato formato. |
Timestamp to Datetime | Converte un timestamp in data/ora. |
Codificatori e decodificatori
Direttiva | Descrizione |
---|---|
Decodifica | Decodifica un valore di colonna come base32 ,
base64 o hex. |
Codifica | Codifica un valore di colonna come base32 ,
base64 o hex. |
Hashing e mascheramento
Direttiva | Descrizione |
---|---|
Hash | Genera un digest dei messaggi. |
Numero maschera | Applica la maschera di sostituzione ai valori delle colonne. |
Riproduzione casuale con maschera | Applica il mascheramento shuffling ai valori della colonna. |
Le ricerche
Direttiva | Descrizione |
---|---|
Catalogo Ricerca | Ricerca nel catalogo statico dei codici ICD-9, ICD-10-2016 e ICD-10-2017. |
Ricerca tabella | Esegue ricerche nei set di dati delle tabelle. |
Elaborazione del linguaggio naturale
Direttiva | Descrizione |
---|---|
Ramo Parole tokenizzate | Applica l'algoritmo di derivazione di Porter per le parole inglesi. |
Formattatori di output
Direttiva | Descrizione |
---|---|
Scrivere come CSV | Converte un record in formato CSV. |
Scrivere come mappa JSON | Converte il record in una mappa JSON. |
Scrivi JSON Oggetto | Crea un oggetto JSON in base ai campi specificati. |
Formatta come Valuta | Formatta un numero nella valuta specificata dalle impostazioni internazionali. |
Parser
Direttiva | Descrizione |
---|---|
Percorso JSON | Utilizza un DSL (un'espressione di percorso JSON) per analizzare i record JSON. |
Analizza come AVRO Archivio | Analizza un file di dati AVRO. |
Analizza come CSV | Analizza un record di input come valori separati da virgole |
Esegui analisi sintattica come valuta | Analizza un valore di valuta che sia una rappresentazione stringa del traffico locale valuta in un numero. |
Analizza come Data/ora | Analizza la stringa come tipo di dati datetime con un determinato formato. |
Analizza come Excel | Analizza un file Microsoft Excel. |
Analizza come Lunghezza fissa | Viene analizzato come record a lunghezza fissa con larghezze specificate. |
Esegui analisi sintattica come HL7 | Analizza i messaggi di Health Level 7 Version 2 (HL7 V2). |
Esegui l'analisi come JSON | Analizza un oggetto JSON. |
Analizza come Registra | Analizza i file di log degli accessi, come i server Apache httpd e NGINX. |
Analizza come Data semplice | Analizza le stringhe delle date. |
Analizza come Data e ora | Analizza i valori delle colonne che rappresentano il timestamp Unix come data. |
Eseguire l'analisi di XML in JSON | Analizza un documento XML in una struttura JSON. |
Operazioni riga
Direttiva | Descrizione |
---|---|
Filtra le righe | Filtra i record in base a una condizione. |
Filtra riga se corrispondenza | Filtra le righe che corrispondono a un pattern per una colonna. |
Appiatti | Separa gli elementi in un campo ripetuto. |
Errore in data condizione | L'elaborazione non riesce quando la condizione viene valutata su true. |
Invia a Errore | Filtra i record in un collettore di errori. |
Invia a Errore e continua elaborazione | Filtra i record in base a un raccoglitore errori e continua l'elaborazione. |
Suddividi in Righe | Suddivide in più record in base a un separatore. |
Trasformazioni
Direttiva | Descrizione |
---|---|
Cambiare custodia | Modifica le maiuscole e le minuscole dei valori delle colonne caratteri. |
Crea Registra | Crea una colonna di record con valori nidificati copiando i valori dalle colonne di origine in una colonna di destinazione. |
Taglia carattere | Consente di selezionare parti di un valore di stringa. |
Imposta colonna | Imposta il valore della colonna sul risultato dell'esecuzione di un'espressione. |
Trova e Sostituisci | Trasforma i valori delle colonne di tipo stringa utilizzando un'espressione simile a "sed". |
Quantizzazione | Applica la quantizzazione ai valori delle colonne. |
Estrazione di gruppi di espressioni regolari | Estrae i dati da un gruppo di espressioni regolari in un proprio gruppo colonna. |
Imposta Set di caratteri | Imposta la codifica, quindi converte i dati in una stringa UTF-8. |
Imposta delimitatore record | Imposta il delimitatore dei record. |
Email suddivisa | Suddivide un ID email in un account e nel relativo dominio. |
Dividi URL | Suddivide un URL nei suoi componenti. |
Testo Distanza (corrispondenza stringa fuzzy) | Misura la differenza tra due sequenze di caratteri. |
Metrica di testo (Corrispondenza stringa parziale) | Misura la differenza tra due sequenze di caratteri. |
URL Decodifica | Decodifica dal formato MIME application/x-www-form-urlencoded . |
Codifica URL | Codifica nel formato MIME application/x-www-form-urlencoded . |
Tagliare gli spazi | Funzioni per tagliare gli spazi bianchi intorno ai dati stringa. |
Aggregatori e setter temporanei
Direttiva | Descrizione |
---|---|
Variabile di incremento | Incrementa una variabile transitoria con un record di elaborazione. |
Imposta variabile | Imposta una variabile transitoria con un record di elaborazione. |
ID univoco
Direttiva | Descrizione |
---|---|
Genera UUID | Genera un UUID (Universally Unique Identifier). |
Passaggi successivi
- Scopri di più sulle funzioni di Wrangler.