Auf dieser Seite werden die Anweisungen beschrieben, die Sie in Wrangler verwenden können.
Im Power-Modus von Wrangler (Wrangler-Befehlszeile) können Sie einem Rezept Anweisungen und Funktionen hinzufügen. Weitere Informationen finden Sie unter Wrangler-Befehlszeilenanweisungen und Wrangler-Funktionen.
Wrangler unterstützt die folgenden Anweisungen:
Spaltenvorgänge
Anweisung | Beschreibung |
---|---|
Groß-/Kleinschreibung von Spalten ändern | Ändert Spaltennamen in Groß- oder Kleinbuchstaben. |
Groß-/Kleinschreibung ändern | Ändert die Groß- und Kleinschreibung von Spaltenwerten. |
Spaltennamen bereinigen | Bereinigt Spaltennamen nach bestimmten Regeln. |
Spalten Ersetzen | Ändert Spaltennamen im Bulk-Verfahren. |
Text | Kopiert Werte aus einer Quellspalte in eine Zielspalte. |
Ablegen Spalte | Löscht eine Spalte in einem Datensatz. |
Fill Null or Leer | Wenn der Wert null oder leer ist, wird ein fester Spaltenwert eingegeben. |
Google Notizen | Behält die angegebenen Spalten aus dem Datensatz bei. |
Zusammenführen | Führt zwei Spalten durch Einfügen einer dritten Spalte zusammen. |
Umbenennen | Benennt eine vorhandene Spalte im Datensatz um. |
Header festlegen | Legt die Namen von Spalten in der angegebenen Reihenfolge fest. |
In Spalten aufteilen | Teilt eine Spalte anhand eines Trennzeichens in mehrere Spalten auf. |
Tauschen | Vertauscht Spaltennamen von zwei Spalten. |
Settyp | Wandelt den Datentyp einer Spalte um. |
Datumstransformationen
Anweisung | Beschreibung |
---|---|
Diff. | Berechnet die Differenz zwischen zwei Datumsangaben. |
Datum formatieren | Benutzerdefinierte Muster für die Datums-/Uhrzeitformatierung. |
UNIX-Zeitstempel formatieren | Formatiert einen UNIX-Zeitstempel als Datum. |
Datetime-Transformationen
Anweisung | Beschreibung |
---|---|
Aktuell Datum/Uhrzeit | Generiert das aktuelle Datum und die Uhrzeit mit einer bestimmten Zeitzone. |
Datum/Uhrzeit bis Zeitstempel | Erstellt einen Zeitstempel aus einem Datetime-Wert und einer angegebenen Zeitzone. |
Datum/Uhrzeit formatieren | Formatiert Datum und Uhrzeit in einen String eines bestimmten Formats. |
Zeitstempel in Datum/Uhrzeit | Wandelt einen Zeitstempel in Datum/Uhrzeit um. |
Encoder und Decoder
Anweisung | Beschreibung |
---|---|
Dekodieren | Entschlüsselt einen Spaltenwert als einen der Werte base32 , base64 oder hex. . |
Codieren | Codiert einen Spaltenwert als base32 ,
base64 oder hex. |
Hash-Technologie und Maskierung
Anweisung | Beschreibung |
---|---|
Hash | Generiert einen Nachrichten-Digest. |
Maske Zahl | Wendet die Ersatzmaskierung auf die Spaltenwerte an. |
Maske | Wendet eine Shuffle-Maskierung auf die Spaltenwerte an. |
Suchanfragen
Anweisung | Beschreibung |
---|---|
Katalogsuche | Statische Katalogsuche nach ICD-9-, ICD-10-2016- und ICD-10-2017-Codes. |
Tabellenlookup | Führt Suchvorgänge in Tabellen-Datasets durch. |
Natural Language Processing
Anweisung | Beschreibung |
---|---|
Stemming Tokenisierte Wörter | Wendet den Porter-Wortstamm-Algorithmus für englische Wörter an. |
Ausgabeformatierer
Anweisung | Beschreibung |
---|---|
Verfassen als CSV | Konvertiert einen Datensatz in das CSV-Format. |
Verfassen als JSON-Zuordnung | Konvertiert den Datensatz in eine JSON-Map. |
JSON-Objekt schreiben | Erstellt ein JSON-Objekt anhand der angegebenen Felder. |
Als Währung formatieren | Formatiert eine Zahl gemäß den Spracheinstellungen als Währung. |
Parser
Anweisung | Beschreibung |
---|---|
JSON-Pfad | Verwendet eine DSL (einen JSON-Pfadausdruck) zum Parsen von JSON-Einträgen. |
Als AVRO parsen Datei | Parset eine AVRO-Datei. |
Als CSV-Datei parsen | Analysiert einen Eingabeeintrag als durch Kommas getrennte Werte |
Als Währung parsen | Parset einen Währungswert, der eine Stringdarstellung der Landeswährung ist, in eine Zahl. |
Parsen als Datum/Uhrzeit | Analysiert einen String als Datetime-Datentyp mit einem bestimmten Format. |
Parsen als Microsoft Excel | Die Daten werden in eine Microsoft Excel-Datei geparst. |
Parsen als Feste Länge | Parst als Datensatz mit fester Länge und angegebenen Breiten. |
Als HL7 parsen | Hier werden Health Level 7 Version 2-Nachrichten (HL7 V2) geparst. |
Als JSON parsen | Analysiert ein JSON-Objekt. |
Als Protokoll analysieren | Parset Zugriffsprotokolldateien, z. B. von Apache httpd- und NGINX-Servern. |
Parsen als Einfaches Datum | Parset Datumsstrings. |
Parsen als Zeitstempel | Analysiert Spaltenwerte, die den Unix-Zeitstempel als Datum darstellen. |
XML in JSON parsen | Parset ein XML-Dokument in eine JSON-Struktur. |
Zeilenvorgänge
Anweisung | Beschreibung |
---|---|
Zeilen filtern | Filtert Einträge basierend auf einer Bedingung. |
Zeile filtern, wenn Übereinstimmung | Filtert Zeilen, die einem Muster für eine Spalte entsprechen. |
Flatten | Trennt die Elemente in einem wiederkehrenden Feld. |
Fail on Zustand | Die Verarbeitung schlägt fehl, wenn die Bedingung als wahr ausgewertet wird. |
An Fehler senden | Filtert Datensätze für einen Fehler-Collector. |
Senden an Fehler und wird weiter verarbeitet | Er filtert Einträge in einen Fehlersammler und fährt mit der Verarbeitung fort. |
In Zeilen unterteilen | Teilt anhand eines Trennzeichens in mehrere Datensätze auf. |
Transformationen
Anweisung | Beschreibung |
---|---|
Wird geändert Lade-Case | Ändert die Groß- und Kleinschreibung von Spaltenwerten Zeichen. |
Erstellen Datensatz | Erstellt eine Eintragsspalte mit verschachtelten Werten durch Kopieren von Werten aus Quellspalten in eine Zielspalte. |
Ausschneiden Figur | Wählt Teile eines Stringwerts aus. |
Festlegen Spalte | Legt den Spaltenwert auf das Ergebnis der Ausführung eines Ausdrucks fest. |
Suchen und ersetzen | Transformiert Stringspaltenwerte mit einem sed-ähnlichen Ausdruck. |
Quantisierung | Wendet die Quantisierung auf Spaltenwerte an. |
Regex-Gruppen extrahieren | Extrahiert die Daten aus einer Gruppe regulärer Ausdrücke in eine eigene Spalte. |
Festlegen Charset | Legt die Codierung fest und konvertiert die Daten dann in einen UTF-8-String. |
Datensatz festlegen Delim | Legt das Datensatztrennzeichen fest. |
E-Mail teilen | Eine E-Mail-ID wird in ein Konto und seine Domain unterteilt. |
Aufteilen URL | Eine URL in ihre Bestandteile aufteilen. |
Textdistanz (ungenaue Stringübereinstimmung) | Misst die Differenz zwischen zwei Zeichenfolgen. |
Textmesswert (Ungenaue Stringübereinstimmung) | Misst die Differenz zwischen zwei Zeichenfolgen. |
URL-Dekodierung | Dekodiert aus dem MIME-Format application/x-www-form-urlencoded . |
URL-Codierung | Wird mit application/x-www-form-urlencoded -MIME codiert
Format. |
Räume zuschneiden | Funktionen zum Entfernen von Leerräumen um Zeichenfolgendaten. |
Vorübergehende Aggregatoren und Setter
Anweisung | Beschreibung |
---|---|
Anstieg Variable | Erhöht eine sitzungsspezifische Variable um einen Verarbeitungseintrag. |
Festlegen Variable | Legt eine temporäre Variable mit einem Verarbeitungsprotokoll fest. |
Eindeutige ID
Anweisung | Beschreibung |
---|---|
UUID generieren | Generiert eine universell eindeutige Kennung (Universally Unique Identifier, UUID). |