Transform Builder

O Transform Builder permite montar rapidamente etapas completas de transformação por meio de uma interface simples orientada por menus. Depois de selecionar a transformação a ser aplicada, todos os parâmetros relevantes podem ser configurados por meio de campos de seleção ou de sugestão de texto. Assim, você pode escolher apenas os elementos apropriados para a transformação selecionada.

Para abrir o Transform Builder, comece criando uma etapa por meio de um dos métodos a seguir:

Figura: Transform Builder

Atalhos do teclado:

TeclasAção
TABAceitar o item atualmente selecionado e ir para o próximo campo.
SHIFT + TABIr para o campo anterior.

Etapa 1: selecionar transformação no painel Pesquisar

No painel Pesquisar, digite para ver a lista de transformações disponíveis. Selecione sua preferida.

As transformações join e union têm páginas dedicadas à configuração dessas transformações. Insira join ou union como a transformação para abrir a ferramenta correspondente.

Para uma lista de transformações disponíveis, consulte Referência de transformação.

Etapa 2: especificar colunas, fórmula ou condição

Dependendo da transformação selecionada, será necessário especificar um ou mais dos tipos de parâmetros a seguir no Transform Builder.

  • Algumas transformações são compatíveis com combinações dos itens a seguir.
  • Algumas transformações, como deduplicate, não exigem parâmetros.

A seguir estão as categorias gerais de parâmetros:

  • Valores de literal. Um valor de literal ou constante é um número fixo, uma string, um booleano ou outro tipo de valor, que não muda dependendo da linha em avaliação.
  • Funções. O Cloud Dataprep by TRIFACTA® INC. é compatível com uma ampla variedade de tipos numéricos, estatísticos e outros tipos de funções. Para ver uma lista de transformações e funções disponíveis, consulte Índice da linguagem.
  • Colunas. Quando um nome de coluna é usado em uma fórmula, a transformação usa o valor na coluna nomeada para a linha atualmente avaliada.
  • Operadores. Você pode aplicar operadores lógicos, numéricos ou de comparação como parte de sua fórmula.
  • Metadados. É possível inserir strings especiais que avaliam as referências dos metadados do seu conjunto de dados. Para mais informações, consulte Referências de metadados de origem.

Colunas

Selecione ou especifique a coluna ou colunas às quais aplicar a transformação.

Dica: para especificar um intervalo de colunas, digite um til (~) após a primeira coluna. A segunda coluna que você seleciona define a última coluna do intervalo. Algumas transformações não são compatíveis com múltiplas colunas ou intervalos de colunas.

Padrões

Para algumas transformações, você pode especificar padrões que identifiquem condições ou elementos dos dados sobre os quais agir. Esses padrões de correspondência podem ser especificados por meio de um dos tipos a seguir.

Dica: depois de usar um padrão ou um literal de string em uma etapa de transformação, você pode aplicá-lo em outra. No campo de padrão no Transform Builder, clique em Procurar histórico de padrões.

Tipo de padrãoDescriçãoExemplo
Valor de literal String ou valor exato.

A expressão a seguir corresponde ao valor exato entre as aspas:

'This is what I want to match.'

Padrão do Cloud Dataprep

O Cloud Dataprep by TRIFACTA INC. é compatível com uma variedade de identificadores de padrões de macro, que podem ser usados em vez de expressões regulares mais complexas.

O seguinte corresponde quando dois dígitos aparecem no início de um valor:

`{start}{digit} {digit}`

Padrão de expressão regular

Expressões regulares são um método padrão para descrever padrões de correspondência.

OBSERVAÇÃO: a sintaxe das expressões regulares pode ser complexa e gerar resultados inesperados se especificada incorretamente. A expressão regular é considerada uma habilidade de nível de desenvolvedor.

A expressão a seguir corresponde a todos os valores numéricos de 0 a 99:

/^\d$|^\d\d$/

Para mais informações sobre a correspondência baseada em padrões, consulte Correspondência de texto.

Grupos delimitadores

No Transform Builder, as transformações que exigem delimitador são organizadas em grupos de delimitadores, de modo que você especifique apenas os elementos de um padrão que funcionam em conjunto. Grupos de delimitadores aplicam-se às transformações abaixo:

Os grupos de delimitadores estão listados abaixo.

Grupo delimitadorDescrição
No delimitadorA transformação é aplicada com base em um literal ou padrão específico.
Entre delimitadoresA transformação é aplicada no banco de dados entre dois delimitadores literais ou baseados em padrão. Veja os detalhes abaixo.
Em vários delimitadores

A transformação é aplicada com base em uma sequência de delimitadores. Um padrão individual pode ser um literal de string, um padrão do Cloud Dataprep ou uma expressão regular, e a sequência pode conter combinações desses tipos de padrões.

Entre posiçõesA transformação é aplicada com base em uma posição de índice inicial e em uma posição de índice final. As posições do índice começam em 0 no lado esquerdo de qualquer valor de célula.
Nas posiçõesA transformação é aplicada com base em uma sequência de posições de índice listadas. As posições do índice começam em 0 no lado esquerdo de qualquer valor de célula.
No intervalo regularA transformação é aplicada a cada enésima posição. As posições do índice começam em 0 no lado esquerdo de qualquer valor de célula.

Para mais informações sobre a sintaxe subjacente para grupos de delimitadores, consulte Correspondência de posição da cláusula padrão.

Entre dois delimitadores

Corresponde a quaisquer valores exibidos entre dois delimitadores. Um delimitador descreve o início da correspondência e o outro delimitador descreve o final da correspondência.

Cada delimitador pode incluir ou excluir o valor correspondente:

Opção do Transform BuilderIncluir como parte da transformaçãoIncluir/excluir
Iniciar delimitador falsoExclui subpadrão
Iniciar delimitadorverdadeiroInclui subpadrão
Finalizar delimitadorfalsoExclui subpadrão
Finalizar delimitadorverdadeiroInclui subpadrão

Condição

Condição é uma expressão que produz um valor true ou false. Uma condição pode incluir todos os elementos de uma fórmula. Esse valor determina se a transformação é aplicada à linha avaliada.

Etapa 3: como agrupar, ordenar e nomear

Uma série de transformações aceita os parâmetros a seguir.Parâmetro Group: em transformações que agregam dados, como pivot ou window, especifique a coluna em que você quer agrupar as agregações calculadas. No exemplo a seguir, todos os valores na coluna POS_Sales são somados para cada valor na coluna Store_Nbr.

Nome da transformação Pivot columns
Parâmetro: rótulos da linha Store_Nbr
Parâmetro: valores sum(POS_Sales)

Pressupondo-se que haja entradas na coluna Store_Nbr, o passo de transformação resultante tem 50 linhas, cada uma contendo o total de vendas do número de loja listado.

Parâmetro order: algumas transformações aceitam o parâmetro order. Com ele, é possível especificar a coluna de valores utilizada para classificar a saída. No exemplo a seguir, todos os valores de Sales agregados são ordenados pela data do contrato e agrupados por Estado:

Nome da transformação Pivot columns
Parâmetro: rótulos da linha Store_Nbr
Parâmetro: rótulos da coluna contractDate
Parâmetro: valores sum(Sales)

Parâmetro New Column Name: em transformações que geram novas colunas, como derive e extract, é possível especificar o nome da nova coluna. Isso economiza a adição de uma etapa para renomeá-la. No exemplo a seguir, os valores de colA e colB são somados e gravados na nova coluna colC:

Nome da transformação New formula
Parâmetro: tipo de fórmula Single row formula
Parâmetro: fórmula colA + colB
Parâmetro: novo nome da coluna colC

Passo 3: especificar outros parâmetros

Dependendo da transformação, podem aparecer outros parâmetros necessários ou opcionais para especificar. Consulte Transformações.

Etapa 4: adicionar à receita

Ao terminar a etapa de transformação, analise a visualização na grade de dados.

Se os resultados estiverem aparentemente corretos, clique em Adicionar.

A etapa é adicionada à receita e aplicada à grade de dados.

Editar uma transformação

Depois de adicionar uma etapa, você pode modificá-la conforme necessário. No painel Receita, selecione o ícone de lápis ao lado da etapa da receita. A etapa é exibida para edição no Transform Builder.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.