Esta página descreve as diretivas que você pode usar no Wrangler.
No modo avançado do Wrangler (a CLI do Wrangler), é possível adicionar diretivas e funções a um roteiro. Para mais informações, consulte Diretivas da CLI do Wrangler e Funções do Wrangler.
O Wrangler oferece suporte às seguintes diretivas:
Operações de coluna
| Diretiva | Descrição |
|---|---|
| Mudar o caso da coluna | Muda os nomes das colunas para letras minúsculas ou maiúsculas. |
| Como mudar a caixa | Muda a caixa dos valores da coluna. |
| Limpar nomes de colunas | Limpa os nomes das colunas, seguindo regras específicas. |
| Substituir colunas | Altera os nomes das colunas em massa. |
| Texto | Copia valores de uma coluna de origem para uma coluna de destino. |
| Coluna suspensa | Descarta uma coluna em um registro. |
| Preencher nulos ou em branco | Se o valor for nulo ou vazio, insira um valor de coluna fixo. |
| Keep | Mantém as colunas especificadas do registro. |
| Mesclar | Mescla duas colunas inserindo uma terceira. |
| Renomear | Renomeia uma coluna no registro. |
| Definir cabeçalhos | Define os nomes das colunas na ordem especificada. |
| Dividir em colunas | Divide uma coluna com base em um separador em várias colunas. |
| Troca | Troca os nomes de duas colunas. |
| Tipo do conjunto | Converte o tipo de dados de uma coluna. |
Transformações de data
| Diretiva | Descrição |
|---|---|
| Data da diferença | Calcula a diferença entre duas datas. |
| Formatar data | Padrões personalizados para formatação de data e hora. |
| Formatar carimbo de data/hora UNIX | Formata um carimbo de data/hora UNIX como uma data. |
Transformações de data e hora
| Diretiva | Descrição |
|---|---|
| Data/hora atual | Gera a data e hora atuais com um determinado fuso horário. |
| Data/hora para carimbo de data/hora | Cria um carimbo de data/hora a partir de um determinado fuso horário e data/hora. |
| Formatar data/hora | Formata a data/hora como uma string de um formato específico. |
| Carimbo de data/hora para data/hora | Converte um carimbo de data/hora em data/hora. |
Codificadores e decodificadores
| Diretiva | Descrição |
|---|---|
| Decodificar | Decodifica um valor de coluna como base32,
base64 ou hex. |
| Codificar | Codifica um valor de coluna como base32,
base64 ou hex. |
Hashing e mascaramento
| Diretiva | Descrição |
|---|---|
| Hash | Gera um resumo de mensagens. |
| Número da máscara | Aplica o mascaramento de substituição aos valores da coluna. |
| Embaralhamento de máscara | Aplica o mascaramento aleatório aos valores das colunas. |
Consultas
| Diretiva | Descrição |
|---|---|
| Pesquisa de catálogo | Pesquisa de catálogo estático de códigos ICD-9, ICD-10-2016 e ICD-10-2017. |
| Consulta de tabelas | Realiza pesquisas em conjuntos de dados de tabelas. |
Processamento de linguagem natural
| Diretiva | Descrição |
|---|---|
| Formação de lema Palavras tokenizadas | Aplica o algoritmo de derivação de Porter para palavras em inglês. |
Formatadores de saída
| Diretiva | Descrição |
|---|---|
| Gravar como CSV | Converte um registro no formato CSV. |
| Gravar como mapa JSON | Converte o registro em um mapa JSON. |
| Escrever objeto JSON | Compone um objeto JSON com base nos campos especificados. |
| Formatar como moeda | Formata um número como moeda conforme especificado pela localidade. |
Analisadores
| Diretiva | Descrição |
|---|---|
| Caminho JSON | Usa uma DSL (uma expressão de caminho JSON) para analisar registros JSON. |
| Analisar como arquivo AVRO | Analisa um arquivo de dados AVRO. |
| Analisar como CSV | Analisa um registro de entrada como valores separados por vírgulas |
| Analisar como moeda | Analisa um valor de moeda que é uma representação de string da moeda local em um número. |
| Analisar como data/hora | Analisa a string como um tipo de dados datetime com um formato específico. |
| Analisar como Excel | Analisa em um arquivo do Microsoft Excel. |
| Analisar como comprimento fixo | Analisa como um registro de comprimento fixo com larguras especificadas. |
| Analisar o HL7 | Analisa mensagens do Health Level 7 versão 2 (HL7 V2). |
| Analisar como JSON | Analisa um objeto JSON. |
| Analisar como registro | Analisa arquivos de registro de acesso, como servidores Apache httpd e NGINX. |
| Analisar como data simples | Analisa strings de data. |
| Analisar como carimbo de data/hora | Analisa os valores da coluna que representam o carimbo de data/hora Unix como data. |
| Analisar XML em JSON | Analisa um documento XML em uma estrutura JSON. |
Operações de linha
| Diretiva | Descrição |
|---|---|
| Filtrar linhas | Filtra registros com base em uma condição. |
| Filtrar linha se corresponder | Filtra linhas que correspondem a um padrão de uma coluna. |
| Flatten (link em inglês) | Separa os elementos em um campo repetido. |
| Falha na condição | O processamento falha quando a condição é avaliada como verdadeira. |
| Enviar para Erro | Filtra registros para um coletor de erros. |
| Enviar para processamento de erro e continuar | Filtra registros para um coletor de erros e continua o processamento. |
| Dividir em linhas | Divide em vários registros com base em um delimitador. |
Transformações
| Diretiva | Descrição |
|---|---|
| Como mudar a caixa | Muda a caixa dos valores da coluna para caracteres maiúsculos ou minúsculos. |
| Criar registro | Cria uma coluna de registro com valores aninhados copiando valores das colunas de origem para uma coluna de destino. |
| Cortar caractere | Seleciona partes de um valor de string. |
| Definir coluna | Define o valor da coluna como o resultado da execução de uma expressão. |
| Localizar e substituir | Transforma os valores de colunas de string usando uma expressão semelhante a "sed". |
| Quantização. | Aplica a quantização aos valores de coluna. |
| Extrair grupos de expressões regulares | Extrai os dados de um grupo de expressões regulares para a própria coluna. |
| Definir o conjunto de caracteres | Define a codificação e converte os dados em uma string UTF-8. |
| Definir delimitador de registro | Define o delimitador de registro. |
| E-mail dividido | Divide um ID de e-mail em uma conta e o domínio dela. |
| URL dividido | Divide um URL nos elementos constituintes dele. |
| Distância do texto (correspondência de string difusa) | Mede a diferença entre duas sequências de caracteres. |
| Métrica de texto (correspondência de string difusa) | Mede a diferença entre duas sequências de caracteres. |
| Decodificação de URL | Decodifica do formato MIME
application/x-www-form-urlencoded. |
| Codificação de URL | Codifica no formato MIME
application/x-www-form-urlencoded. |
| Aparar espaços | Funções para remover espaços em branco em torno de dados de string. |
Agregadores e setters temporários
| Diretiva | Descrição |
|---|---|
| Variável de incremento | Incrementa uma variável temporária com um registro de processamento. |
| Definir variável | Define uma variável temporária com um registro de processamento. |
ID exclusivo
| Diretiva | Descrição |
|---|---|
| Gerar UUID | Gera um identificador universalmente exclusivo (UUID). |
A seguir
- Saiba mais sobre as funções do Wrangler.