Diretivas de linha de comando do Wrangler

Esta página descreve as diretivas que você pode usar no Wrangler.

No modo Power do Wrangler (a CLI do Wrangler), você pode adicionar diretivas e funções a um roteiro. Para mais informações, consulte Diretivas da CLI Wrangler e Funções Wrangler.

O Wrangler é compatível com as seguintes diretivas:

Operações de coluna

Diretiva Descrição
Alterar Column Case Muda os nomes das colunas para minúsculas ou maiúsculas.
Como mudar a caixa Altera o caso dos valores da coluna.
Limpar Nomes de colunas Limpa os nomes das colunas, seguindo regras específicas.
Substituir colunas Altera os nomes das colunas em massa.
Texto Copia valores de uma coluna de origem para uma coluna de destino.
Coluna suspensa Descarta uma coluna em um registro.
Preencher Nulo ou Vazio Se o valor for nulo ou vazio, insere um valor de coluna fixo.
Keep Mantém as colunas especificadas do registro.
Mesclar Mescla duas colunas inserindo uma terceira.
Renomear Renomeia uma coluna existente no registro.
Definir Cabeçalhos Define os nomes das colunas na ordem especificada.
Dividir para Colunas Divide uma coluna com base em um separador em várias colunas.
Trocar Troca os nomes de duas colunas.
Definir Tipo Converte o tipo de dados de uma coluna.

Transformações de data

Diretiva Descrição
Dif. Data Calcula a diferença entre duas datas.
Formatar data Padrões personalizados para formatação de data e hora.
Formatar carimbo de data/hora UNIX Formata um carimbo de data/hora UNIX como uma data.

Transformações de data e hora

Diretiva Descrição
Data/hora atual Gera a data e hora atuais com um determinado fuso horário.
Data e hora até Carimbo de data/hora Cria um carimbo de data/hora com base em uma data e hora e um determinado fuso horário.
Formato Data e hora Formata datetime para uma string de um determinado formato.
Carimbo de data/hora para data/hora Converte um carimbo de data/hora em datetime.

Codificadores e decodificadores

Diretiva Descrição
Decodificar Decodifica um valor de coluna como base32, base64 ou hex.
Codificar Codifica um valor de coluna como base32. base64 ou hex.

Hash e mascaramento

Diretiva Descrição
Hash Gera um resumo de mensagens.
Máscara Número Aplica o mascaramento de substituição aos valores da coluna.
Máscara Ordem aleatória Aplica o mascaramento aleatório aos valores das colunas.

Pesquisas

Diretiva Descrição
Pesquisa de catálogo Pesquisa de catálogo estático de códigos ICD-9, ICD-10-2016 e ICD-10-2017.
Tabela Pesquisa Realiza pesquisas em conjuntos de dados de tabelas.

Processamento de linguagem natural

Diretiva Descrição
Formação de lema Palavras tokenizadas Aplica o algoritmo de derivação de Porter para palavras em inglês.

Formatadores de saída

Diretiva Descrição
Escrever como CSV Converte um registro no formato CSV.
Escrever como Mapa JSON Converte o registro em um mapa JSON.
Escrever objeto JSON Compone um objeto JSON com base nos campos especificados.
Formatar como Moeda Formata um número como moeda conforme especificado pela localidade.

Analisadores

Diretiva Descrição
Caminho JSON Usa uma DSL (uma expressão de caminho JSON) para analisar registros JSON.
Analisar como AVRO Arquivo Analisa um arquivo de dados AVRO.
Analisar como CSV Analisa um registro de entrada como valores separados por vírgulas
Analisar como Moeda Analisa um valor de moeda que é uma representação de string da moeda local em um número.
Analisar como Data e hora Analisa a string como um tipo de dados datetime com um formato específico.
Analisar como Excel Analisa em um arquivo do Microsoft Excel.
Analisar como comprimento fixo Analisa como um registro de comprimento fixo com larguras especificadas.
Analisar como HL7 Analisa mensagens do Health Level 7 versão 2 (HL7 V2).
Analisar como JSON Analisa um objeto JSON.
Analisar como Registro Analisa arquivos de registro de acesso, como servidores Apache httpd e NGINX.
Analisar como Data simples Analisa strings de data.
Analisar como Carimbo de data/hora Analisa valores de coluna que representam o carimbo de data/hora Unix como data.
Analisar XML para JSON Analisa um documento XML em uma estrutura JSON.

Operações de linha

Diretiva Descrição
Filtrar Linhas Filtra registros com base em uma condição.
Filtrar linha se corresponder Filtra as linhas que correspondem a um padrão de uma coluna.
Nivelar Separa os elementos em um campo repetido.
Falha em condição O processamento falha quando a condição é avaliada como verdadeira.
Enviar para Erro Filtra registros para um coletor de erros.
Enviar para Erro e continue o processamento Filtra registros para um coletor de erros e continua o processamento.
Dividir em linhas Divide em vários registros com base em um delimitador.

Transformações

Diretiva Descrição
Alterando Caso Muda a caixa dos valores da coluna para caracteres maiúsculos ou minúsculos.
Criar registro Cria uma coluna de registro com valores aninhados copiando valores das colunas de origem para uma coluna de destino.
Cortar o caractere Seleciona partes de um valor de string.
Definir coluna Define o valor da coluna como o resultado da execução de uma expressão.
Localizar e substituir Transforma os valores de colunas de string usando uma expressão semelhante a "sed".
Quantização. Aplica a quantização aos valores de coluna.
Extração Grupos de regex Extrai os dados de um grupo de expressões regulares para a própria coluna.
Definir o conjunto de caracteres Define a codificação e converte os dados em uma string UTF-8.
Configurar registro Delim Define o delimitador de registro.
Divisão E-mail Divide um ID de e-mail em uma conta e no domínio dela.
URL dividido Divide um URL nos elementos constituintes dele.
Texto Distância (correspondência de string difusa) Mede a diferença entre duas sequências de caracteres.
Métrica de texto (Correspondência de string difusa) Mede a diferença entre duas sequências de caracteres.
URL Decodificar Decodifica do formato MIME application/x-www-form-urlencoded.
Codificação de URL Codifica no formato MIME application/x-www-form-urlencoded.
Cortar espaços Funções para cortar espaços em branco ao redor de dados de string.

Agregadores e setters temporários

Diretiva Descrição
Variável de incremento Incrementa uma variável temporária com um registro de processamento.
Definir Variável Define uma variável temporária com um registro de processamento.

ID exclusivo

Diretiva Descrição
Gerar UUID Gera um identificador universalmente exclusivo (UUID).

A seguir