Directives de ligne de commande Wrangler

Cette page décrit les directives que vous pouvez utiliser dans Wrangler.

En mode Power (mode Puissance) de Wrangler (CLI Wrangler), vous pouvez ajouter des directives et des fonctions à une recette. Pour en savoir plus, consultez les pages Directives de la CLI Wrangler et Fonctions Wrangler.

Wrangler est compatible avec les directives suivantes:

Opérations sur les colonnes

Directive Description
Modifier la casse des colonnes Convertit les noms de colonne en minuscules ou en majuscules.
Modifier la casse Modifie la casse des valeurs de colonne.
Nettoyer les noms de colonnes Nettoie les noms de colonnes, en suivant des règles spécifiques.
Colonnes Modifie les noms de colonnes de façon groupée.
Copy Copier les valeurs d'une colonne source dans une colonne de destination
Colonne de dépôt Supprime une colonne d'un enregistrement.
Remplir les valeurs nulles ou vides Si la valeur est nulle ou vide, une valeur de colonne fixe est saisie.
Keep Conserve les colonnes spécifiées de l'enregistrement.
Fusionner Fusionne deux colonnes en insérant une troisième colonne.
Renommer Renomme une colonne existante de l'enregistrement.
Définir des en-têtes Définit les noms des colonnes dans l'ordre où ils sont spécifiés.
Diviser en colonnes Fractionne une colonne en plusieurs colonnes en fonction d'un séparateur.
Permuter Interchange les noms de deux colonnes.
Type de jeu Convertit le type de données d'une colonne.

Transformations de date

Directive Description
Différence de date Calcule la différence entre deux dates.
Formater la date Modèles personnalisés pour la mise en forme de la date et de l'heure.
Formater un code temporel UNIX Met en forme un code temporel UNIX sous forme de date.

Transformations de date et d'heure

Directive Description
Heure actuelle Génère la date/heure actuelle avec un fuseau horaire donné.
Date et heure en code temporel Crée un code temporel à partir d'une date/heure et d'un fuseau horaire donné.
Formater la date/heure Met en forme la date et l'heure au format d'une chaîne donnée.
Code temporel en date et heure Convertit un code temporel en date et heure.

Encodeurs et décodeurs

Directive Description
Décodage Décode une valeur de colonne en tant que base32, base64 ou hex..
Encoder Encode une valeur de colonne en tant que base32, base64 ou hex..

Hachage et masquage

Directive Description
Hachage Génère un condensé du message.
Numéro de masque Applique le masquage par substitution aux valeurs de la colonne.
Mélange des masques Applique le masquage aléatoire aux valeurs de la colonne.

Recherches

Directive Description
Recherche dans le catalogue Recherche statique dans le catalogue des codes ICD-9, ICD-10-2016 et ICD-10-2017.
Recherche dans un tableau Effectue des recherches dans les ensembles de données de table.

Traitement du langage naturel

Directive Description
Réduction des mots tokenisés Applique l'algorithme de stemmer de Porter aux mots anglais.

Outils de mise en forme de sortie

Directive Description
Écrire au format CSV Convertit un enregistrement au format CSV.
Écrire en tant que carte JSON Convertit l'enregistrement en carte JSON.
Écrire un objet JSON Compose un objet JSON en fonction des champs spécifiés.
Format en devise Formate un nombre en tant que devise, comme spécifié par les paramètres régionaux.

Analyseurs

Directive Description
Chemin d'accès JSON Utilise un DSL (une expression de chemin JSON) pour analyser les enregistrements JSON.
Analyser en tant que fichier AVRO Analyse un fichier de données AVRO.
Analyser au format CSV Analyse un enregistrement d'entrée sous la forme de valeurs séparées par une virgule
Analyser en tant que devise Convertit une valeur de devise qui est une représentation de chaîne de la devise locale en nombre.
Analyser en tant que date/heure Analyse la chaîne en tant que type de données "date et heure" avec un format donné.
Analyser en tant qu'Excel Analyse dans un fichier Microsoft Excel.
Analyser en tant que longueur fixe Analyse en tant qu'enregistrement de longueur fixe avec des largeurs spécifiées.
Analyser en tant que HL7 Analyse les messages HL7 V2 (Health Level 7 Version 2).
Analyser au format JSON Analyse un objet JSON.
Analyser en tant que journal Analyse les fichiers de journaux d'accès, tels que les serveurs Apache httpd et NGINX.
Analyser en tant que date simple Analyse les chaînes de date.
Analyser en tant que code temporel Analyse les valeurs de colonne représentant un code temporel Unix sous forme de date.
Analyser le fichier XML en JSON Analyse un document XML dans une structure JSON.

Opérations sur les lignes

Directive Description
Filtrer les lignes Filtre les enregistrements en fonction d'une condition.
Filtrer la ligne si correspondance Filtre les lignes qui correspondent à un modèle pour une colonne.
Aplatir Sépare les éléments d'un champ répété.
Échec en cas de condition Le traitement échoue lorsque la condition est évaluée à "true".
Erreur d'envoi à Filtre les enregistrements vers un collecteur d'erreurs.
Envoyer à l'erreur et continuer le traitement Filtre les enregistrements vers un collecteur d'erreurs et poursuit le traitement.
Diviser en lignes Scinde en plusieurs enregistrements en fonction d'un séparateur.

Transformations

Directive Description
Modifier la casse Convertit les valeurs de la colonne en majuscules ou en minuscules.
Créer un enregistrement Crée une colonne d'enregistrements avec des valeurs imbriquées en copiant les valeurs des colonnes sources dans une colonne de destination.
Caractère coupé Sélectionne des parties d'une valeur de chaîne.
Définir la colonne Définit la valeur de la colonne sur le résultat de l'exécution d'une expression.
Rechercher et remplacer Transforme les valeurs de colonne de chaîne à l'aide d'une expression semblable à "sed".
Quantification Applique la quantification aux valeurs de la colonne.
Extraire des groupes d'expressions régulières Extrait les données d'un groupe d'expressions régulières dans sa propre colonne.
Définir le jeu de caractères Définit l'encodage, puis convertit les données en chaîne UTF-8.
Définir la séparatrice d'enregistrement Définit le délimiteur d'enregistrement.
Diviser l'e-mail Divisez une adresse e-mail en compte et en domaine.
URL fractionnée Divisez une URL en ses composants.
Distance de texte (correspondance de chaîne floue) Mesure la différence entre deux séquences de caractères.
Métrique de texte (correspondance partielle de chaîne) Mesure la différence entre deux séquences de caractères.
Décodage d'URL Décode à partir du format MIME application/x-www-form-urlencoded.
Encodage d'URL Encode au format MIME application/x-www-form-urlencoded.
Couper les espaces Fonctions permettant de couper les espaces blancs autour des données de chaîne.

Agrégateurs et setters temporaires

Directive Description
Variable d'incrément Incrémente une variable temporaire avec un enregistrement de traitement.
Définir une variable Définit une variable temporaire avec un enregistrement du traitement.

ID unique

Directive Description
Générer un UUID Génère un identifiant unique universel (UUID).

Étape suivante