Istruzioni a riga di comando di Wrangler

In questa pagina vengono descritte le istruzioni che puoi utilizzare in Wrangler.

In modalità di alimentazione di Wrangler (l'interfaccia a riga di comando di Wrangler), puoi aggiungere istruzioni e funzioni a una formula. Per maggiori informazioni, consulta le direttive dell'interfaccia a riga di comando di Wrangler e le funzioni di Wrangler.

Wrangler supporta le seguenti direttive:

Operazioni sulle colonne

Direttiva Descrizione
Cambia maiuscole e minuscole nelle colonne Modifica i nomi delle colonne in lettere minuscole o maiuscole.
Cambio della richiesta Modifica le maiuscole e le minuscole dei valori delle colonne.
Pulisci i nomi delle colonne Sanitizza i nomi delle colonne, seguendo regole specifiche.
Colonne Sostituisci Modifica collettivamente i nomi delle colonne.
Copy Copia i valori da una colonna di origine in una colonna di destinazione.
Rilascia colonna Elimina una colonna in un record.
Riempi null o vuoto Se il valore è nullo o vuoto, inserisce un valore di colonna fisso.
Keep Mantiene le colonne specificate del record.
Unisci Unisce due colonne inserendo una terza colonna.
Rinomina Rinomina una colonna esistente nel record.
Imposta intestazioni Imposta i nomi delle colonne, nell'ordine in cui sono specificati.
Suddividi in colonne Divide una colonna in più colonne in base a un separatore.
Scambia Scambia i nomi delle colonne di due colonne.
Tipo di impostazione Converte il tipo di dati di una colonna.

Trasformazioni delle date

Direttiva Descrizione
Data diff Calcola la differenza tra due date.
Formato Data Pattern personalizzati per la formattazione di data e ora.
Formato timestamp UNIX Formatta un timestamp UNIX come data.

Trasformazioni data/ora

Direttiva Descrizione
Data/ora attuale Genera la data/ora corrente con un determinato fuso orario.
Da data a timestamp Crea un timestamp a partire da data/ora e fuso orario specificato.
Formato Data/ora Formatta come data/ora una stringa di un determinato formato.
Da timestamp a Datetime Converte un timestamp in data/ora.

Codificatori e decoder

Direttiva Descrizione
Decodifica Decodifica un valore di colonna come uno tra base32, base64 o hex.
Codifica Codifica un valore di colonna come uno tra base32, base64 o hex.

Hashing e mascheramento

Direttiva Descrizione
Hash Genera un digest del messaggio.
Numero maschera Applica il mascheramento di sostituzione ai valori della colonna.
Mask Shuffle Applica il mascheramento shuffling ai valori della colonna.

Ricerche

Direttiva Descrizione
Ricerca del catalogo Ricerca statica nel catalogo dei codici ICD-9, ICD-10-2016 e ICD-10-2017.
Ricerca nella tabella Esegue ricerche nei set di dati delle tabelle.

Elaborazione del linguaggio naturale

Direttiva Descrizione
Parole con radice tokenizzata Applica l'algoritmo di derivazione di Porter per le parole inglesi.

Formattatori di output

Direttiva Descrizione
Scrivi come CSV Converte un record in formato CSV.
Scrivi come mappa JSON Converte il record in una mappa JSON.
Scrivi oggetto JSON Crea un oggetto JSON in base ai campi specificati.
Formatta come valuta Formatta un numero nella valuta specificata dalle impostazioni internazionali.

Parser

Direttiva Descrizione
Percorso JSON Utilizza un DSL (un'espressione di percorso JSON) per analizzare i record JSON.
Analizza come file AVRO Analizza un file di dati AVRO.
Analizza come CSV Analizza un record di input come valori separati da virgole
Analizza come valuta Analizza un valore di valuta che è una rappresentazione stringa della valuta locale in un numero.
Analizza come Data/ora Analizza la stringa come tipo di dati data/ora con un determinato formato.
Analizza come Excel Analizza in un file di Microsoft Excel.
Analizza come lunghezza fissa Analizza come record a lunghezza fissa con larghezze specificate.
Analizza come HL7 Analizza i messaggi di Health Level 7 Version 2 (HL7 V2).
Analizza come JSON Analizza un oggetto JSON.
Analizza come log Analizza i file di log degli accessi, come i server Apache httpd e NGINX.
Analizza come data semplice Analizza le stringhe delle date.
Analizza come timestamp Analizza i valori delle colonne che rappresentano il timestamp Unix come data.
Analizzare il codice XML in JSON Analizza un documento XML in una struttura JSON.

Operazioni riga

Direttiva Descrizione
Filtra righe Filtra i record in base a una condizione.
Filtra riga se corrispondente Filtra le righe che corrispondono a un pattern per una colonna.
Appiattisci Separa gli elementi in un campo ripetuto.
Errore a condizione L'elaborazione non riesce quando la condizione viene valutata su true.
Invia a errore Filtra i record in base a un raccoglitore errori.
Invia all'errore e continua l'elaborazione Filtra i record in base a un raccoglitore errori e continua l'elaborazione.
Dividi in righe Suddivide in più record in base a un separatore.

Trasformazioni

Direttiva Descrizione
Cambio della richiesta Modifica le maiuscole e le minuscole dei valori delle colonne in caratteri maiuscoli o minuscoli.
Crea record Crea una colonna di record con valori nidificati copiando i valori dalle colonne di origine in una colonna di destinazione.
Taglia carattere Seleziona parti di un valore stringa.
Imposta colonna Imposta il valore della colonna sul risultato dell'esecuzione di un'espressione.
Trova e sostituisci Trasforma i valori delle colonne di tipo stringa utilizzando un'espressione simile a "sed".
Quantizzazione Applica la quantizzazione ai valori delle colonne.
Estrai gruppi di regex Estrae i dati da un gruppo di espressioni regolari in una propria colonna.
Imposta set di caratteri Imposta la codifica, quindi converte i dati in una stringa UTF-8.
Imposta record Delim Imposta il delimitatore del record.
Email divisa Suddivide un ID email in un account e nel rispettivo dominio.
Suddividi URL Suddivide un URL nei suoi componenti.
Distanza testo (corrispondenza stringa fuzzy) Misura la differenza tra due sequenze di caratteri.
Metrica di testo (Corrispondenza stringa fuzzy) Misura la differenza tra due sequenze di caratteri.
Decodifica URL Decodifica dal formato MIME application/x-www-form-urlencoded.
Codifica URL Codifica nel formato MIME application/x-www-form-urlencoded.
Taglio degli spazi Funzioni per tagliare gli spazi bianchi intorno ai dati stringa.

Aggregatori e setter temporanei

Direttiva Descrizione
Incrementa variabile Incrementa una variabile transitoria con un record di elaborazione.
Imposta variabile Imposta una variabile transitoria con un record di elaborazione.

ID univoco

Direttiva Descrizione
Genera UUID Genera un UUID (Universally Unique Identifier).

Passaggi successivi