Questa pagina descrive le direttive che puoi utilizzare in Wrangler.
Nella modalità Power di Wrangler (l'interfaccia a riga di comando di Wrangler), puoi aggiungere direttive e funzioni a una ricetta. Per ulteriori informazioni, consulta Istruzioni della CLI di Wrangler e Funzioni di Wrangler.
Wrangler supporta le seguenti direttive:
Operazioni sulle colonne
| Direttiva | Descrizione |
|---|---|
| Modificare la cassetta della colonna | Modifica i nomi delle colonne in lettere minuscole o maiuscole. |
| Cambiare custodia | Modifica la modalità di scrittura dei valori delle colonne. |
| Pulizia dei nomi delle colonne | Sanifica i nomi delle colonne seguendo regole specifiche. |
| Colonne Sostituisci | Modifica collettivamente i nomi delle colonne. |
| Copy | Copia i valori da una colonna di origine in una colonna di destinazione. |
| Colonna inserisci | Elimina una colonna in un record. |
| Riempi con valore Null o vuoto | Se il valore è null o vuoto, inserisci un valore di colonna fisso. |
| Keep | Mantiene le colonne specificate del record. |
| Unisci | Unisce due colonne inserendo una terza colonna. |
| Rinomina | Rinomina una colonna esistente nel record. |
| Imposta intestazioni | Imposta i nomi delle colonne nell'ordine in cui sono specificati. |
| Dividi in colonne | Suddivide una colonna in più colonne in base a un separatore. |
| Scambio | Scambia i nomi di due colonne. |
| Tipo di set | Converte il tipo di dati di una colonna. |
Trasformazioni delle date
| Direttiva | Descrizione |
|---|---|
| Diff Date | Calcola la differenza tra due date. |
| Formato Data | Pattern personalizzati per la formattazione di date e ore. |
| Formattare il timestamp UNIX | Formatta un timestamp UNIX come data. |
Trasformazioni di date e ore
| Direttiva | Descrizione |
|---|---|
| Data e ora correnti | Genera la data e l'ora correnti con un determinato fuso orario. |
| Data/ora a Timestamp | Crea un timestamp da data e ora e da un fuso orario specificato. |
| Formato Data/ora | Formatta la data/ora in una stringa di un determinato formato. |
| Timestamp to Datetime | Converte un timestamp in data/ora. |
Codificatori e decodificatori
| Direttiva | Descrizione |
|---|---|
| Decodifica | Decodifica un valore di colonna come base32,
base64 o hex. |
| Codifica | Codifica un valore di colonna come base32,
base64 o hex. |
Hashing e mascheramento
| Direttiva | Descrizione |
|---|---|
| Hash | Genera un digest dei messaggi. |
| Numero maschera | Applica la maschera di sostituzione ai valori delle colonne. |
| Riproduzione casuale con maschera | Applica la mascheratura con l'ordinamento casuale ai valori delle colonne. |
Le ricerche
| Direttiva | Descrizione |
|---|---|
| Catalogo di ricerca | Ricerca nel catalogo statico dei codici ICD-9, ICD-10-2016 e ICD-10-2017. |
| Ricerca tabella | Esegue ricerche nei set di dati di tabelle. |
Elaborazione del linguaggio naturale
| Direttiva | Descrizione |
|---|---|
| Stemming Parole tokenizzate | Applica l'algoritmo di derivazione di Porter per le parole inglesi. |
Formattatori di output
| Direttiva | Descrizione |
|---|---|
| Scrivere come CSV | Converte un record in formato CSV. |
| Scrivere come mappa JSON | Converte il record in una mappa JSON. |
| Scrivere un oggetto JSON | Compone un oggetto JSON in base ai campi specificati. |
| Formatta come valuta | Formatta un numero come valuta in base alle impostazioni internazionali. |
Parser
| Direttiva | Descrizione |
|---|---|
| Percorso JSON | Utilizza un DSL (un'espressione di percorso JSON) per analizzare i record JSON. |
| Esegui l'analisi come file | Analizza un file di dati AVRO. |
| Esegui l'analisi come CSV | Analizza un record di input come valori separati da virgole |
| Esegui analisi sintattica come valuta | Analizza un valore valuta che è una rappresentazione di stringa della valuta locale in un numero. |
| Esegui l'analisi come Data/ora | Analizza la stringa come tipo di dati datetime con un determinato formato. |
| Esegui analisi come Excel | Analizza un file Microsoft Excel. |
| Esegui analisi sintattica come Lunghezza fissa | Viene analizzato come record a lunghezza fissa con larghezze specificate. |
| Esegui analisi sintattica come HL7 | Analizza i messaggi Health Level 7 Version 2 (HL7 V2). |
| Esegui analisi come JSON | Analizza un oggetto JSON. |
| Esegui analisi sintattica come log | Analizza i file di log di accesso, ad esempio i server Apache httpd e NGINX. |
| Esegui analisi sintattica come data semplice | Analizza le stringhe di date. |
| Esegui l'analisi come timestamp | Analizza i valori di colonna che rappresentano il timestamp Unix come data. |
| Eseguire l'analisi di XML in JSON | Analizza un documento XML in una struttura JSON. |
Operazioni sulle righe
| Direttiva | Descrizione |
|---|---|
| Filtra le righe | Filtra i record in base a una condizione. |
| Filtra riga se corrispondenza | Filtra le righe che corrispondono a un pattern per una colonna. |
| Appiatti | Separa gli elementi in un campo ripetuto. |
| Fallo su condizione | L'elaborazione non va a buon fine quando la condizione viene valutata come true. |
| Errore di Invia a | Filtra i record in un collettore di errori. |
| Invia a Errore e continua l'elaborazione | Filtra i record in un collettore di errori e continua l'elaborazione. |
| Dividi in righe | Suddivide in più record in base a un separatore. |
Trasformazioni
| Direttiva | Descrizione |
|---|---|
| Cambiare custodia | Modifica la modalità maiuscole/minuscole dei valori di colonna in caratteri maiuscoli o minuscoli. |
| Crea record | Crea una colonna di record con valori nidificati copiando i valori dalle colonne di origine in una colonna di destinazione. |
| Taglia carattere | Consente di selezionare parti di un valore di stringa. |
| Imposta colonna | Imposta il valore della colonna sul risultato dell'esecuzione di un'espressione. |
| Trova e sostituisci | Trasforma i valori delle colonne di stringhe utilizzando un'espressione simile a "sed". |
| Quantizzazione | Applica la quantizzazione ai valori delle colonne. |
| Estrazione di gruppi di espressioni regolari | Estrae i dati da un gruppo di espressioni regolari in una colonna distinta. |
| Imposta Charset | Imposta la codifica e poi converte i dati in una stringa UTF-8. |
| Imposta delimitatore record | Imposta il delimitatore dei record. |
| Email suddivisa | Suddivide un ID email in un account e nel relativo dominio. |
| URL suddiviso | Suddivide un URL nei suoi componenti. |
| Distanza del testo (corrispondenza stringa approssimativa) | Misura la differenza tra due sequenze di caratteri. |
| Metrica testo (corrispondenza stringa approssimativa) | Misura la differenza tra due sequenze di caratteri. |
| Decodifica URL | Decodifica dal formato MIME application/x-www-form-urlencoded. |
| Codifica URL | Codifica nel formato MIME application/x-www-form-urlencoded. |
| Tagliare gli spazi | Funzioni per tagliare gli spazi vuoti intorno ai dati di stringa. |
Aggregatori e setter temporanei
| Direttiva | Descrizione |
|---|---|
| Variabile di incremento | Aumenta una variabile transitoria con un record di elaborazione. |
| Imposta variabile | Imposta una variabile transitoria con un record dell'elaborazione. |
ID univoco
| Direttiva | Descrizione |
|---|---|
| Genera UUID | Genera un identificatore univoco universale (UUID). |
Passaggi successivi
- Scopri di più sulle funzioni di Wrangler.