Transformações

OBSERVAÇÃO: as transformações fazem parte da linguagem subjacente não diretamente acessível aos usuários. Esse conteúdo é mantido apenas para fins de referência.

No Wrangle, uma transformação é uma ação aplicada ao conjunto de dados. Cada etapa da receita corresponde a uma transformação totalmente especificada.

Dica: para ver transformações por categoria, clique nos botões de classificação no cabeçalho "Categoria", da documentação on-line.

TransformaçãoCategoriaDescrição
Transformação CaseOutraExecuta a lógica if/then/else ou case nas linhas do seu conjunto de dados.
Transformação CommentOutraInsere um comentário não funcional como uma etapa da receita.
Transformação CountpatternPesquisar e substituirConta o número de instâncias de um padrão especificado em uma coluna e grava esse valor em uma coluna recém-gerada. A coluna de origem permanece inalterada.
Transformação DeduplicateGerenciar linhasRemove as linhas duplicadas exatas do conjunto de dados. As linhas duplicadas são identificadas por correspondências exatas entre valores. Por exemplo, duas strings com letras maiúsculas diferentes não correspondem.
Transformação DeleteGerenciar linhasExclui um conjunto de linhas no conjunto de dados, com base em uma condição especificada na expressão row. Se a expressão condicional for true, a linha será excluída.
transformação DeriveGerenciar colunasGere uma nova coluna em que os valores são a saída da expressão value. A expressão pode ser calculada com base nos valores especificados no parâmetro group. A coluna de saída pode ser nomeada conforme necessário.
Transformação DropGerenciar colunasUma ou mais colunas especificadas são removidas permanentemente do conjunto de dados.
Transformação ExtractPesquisar e substituirExtrai um subconjunto de dados de uma coluna e insere-o em uma nova coluna, com base em uma string ou um padrão especificado. A coluna de origem não é modificada.
Transformação ExtractkvPesquisar e substituir

Extrai pares de chave-valor de uma coluna de origem e os grava em uma nova coluna. A coluna de origem precisa ser do tipo "String", mesmo que os dados possam ser formatados como outros tipos.

Transformação ExtractlistPesquisar e substituirExtrai um conjunto de valores com base em um padrão especificado de uma coluna de origem de qualquer tipo de dados. A coluna gerada contém uma série de ocorrências do padrão especificado. A nova coluna contém os dados de matriz, mas o tipo de dados da nova coluna às vezes é inferido como "String".
Transformação FilterGerenciar linhasMantém ou exclui linhas em seu conjunto de dados com base em um tipo de filtro definido.
Transformação FlattenDados aninhadosDescompacta dados da matriz em linhas separadas para cada valor.
Transformação HeaderAnálise inicialUsa uma linha da amostra do conjunto de dados como a linha de cabeçalho da tabela. Cada valor nessa linha torna-se o nome da coluna em que ele está localizado.
Transformação KeepGerenciar linhasMantém um conjunto de linhas no conjunto de dados. Elas são especificadas pelo condicional na expressão row. Todas as outras linhas são removidas do conjunto de dados.
Transformação MergeGerenciar colunasCombina duas ou mais colunas no conjunto de dados para criar uma nova coluna de tipo "String". Você também tem a opção de inserir um delimitador entre os valores mesclados.
Transformação MoveGerenciar colunasMove uma ou mais colunas especificadas para antes ou depois de outra coluna no conjunto de dados.
Transformação NestDados aninhadosCria um Objeto ou Matriz de valores usando nomes de colunas e os respectivos valores como pares chave-valor para uma ou mais colunas. O tipo de coluna gerada é determinado pelo parâmetro into.
Transformação PivotDados aninhados

A transformação pivot pode ser usada para agregar ou representar dinamicamente seus dados em colunas e agregar os resultados. Com ela, o conjunto de dados é organizado em informações resumidas.

Quando você agrega dados, os cálculos são realizados em valores de coluna, que são agrupados e ordenados com base em parâmetros especificados.

Quando você representa dinamicamente os dados, os valores de uma coluna selecionada tornam-se novas colunas no conjunto de dados. Cada uma contém um cálculo de resumo que você especifica. Esse cálculo pode ser baseado em todas as linhas para totais em todo o conjunto de dados ou ter como base o grupo de linhas que você define na transformação.

Transformação RenameGerenciar colunasUma ou mais colunas são renomeadas com nomes os especificados ou são anexados nomes de colunas com valores específicos.
Transformação ReplacePesquisar e substituirSão substituídos os valores dentro da coluna especificada ou das colunas especificadas com base no literal, no padrão ou na localização da string dentro do valor da célula, conforme especificado na transformação.
Transformação SetPesquisar e substituirSubstitui todos os valores na coluna especificada pelo valor definido, que pode ser literal ou uma expressão. É possível especificar um parâmetro row: opcional, contendo um teste condicional para identificar as linhas em que a substituição deve ser feita dentro da coluna.
Transformação SettypeGerenciar colunasDefine o tipo de dados da coluna especificada. Esta transformação não modifica os valores de origem. Os dados na coluna são inferidos novamente em relação ao tipo de dados especificado, o que pode alterar os resultados do perfil de coluna.
Transformação SplitAnálise inicialDivide a coluna especificada em colunas de dados separadas com base nos delimitadores na transformação. Os delimitadores podem ser especificados em vários métodos descritos abaixo.
Transformação SplitrowsAnálise inicialDivide uma coluna de valores em linhas separadas de dados com base no delimitador especificado. Você pode dividir as linhas apenas em valores literais de string. A divisão de linhas baseada em padrões não é aceita.
Transformação UnnestDados aninhados

Descompacta dados aninhados de uma coluna Matriz ou Objeto para criar novas linhas ou colunas com base nas chaves dos dados de origem. Essa transformação funciona de modo diferente nas colunas do tipo Objeto ou Matriz.

Transformação UnpivotDados aninhadosReestrutura o layout dos dados, mesclando uma ou mais colunas em colunas de chave e valor. As chaves são os nomes das colunas de entrada e os valores são os valores das células das colunas de origem. As linhas de dados são duplicadas uma vez para cada coluna de entrada.
Transformação ValuestocolsGerenciar colunasPara cada valor exclusivo em uma coluna, é criada uma coluna separada. Para cada linha que contém o valor na coluna de origem, um valor indicador é inserido na nova coluna. Esse valor pode ser um valor literal ou a saída de uma função. Se nenhum valor indicador for gerado, um valor nulo será gravado.
Transformação WindowAgregaçãoA transformação window permite que você execute resumos e cálculos com base em uma janela contínua dos dados relativos à linha atual. Por exemplo, você pode computar a média contínua de uma coluna especificada para o valor da linha atual e as nove linhas precedentes. Essa transformação é particularmente útil para processar tempo ou dados sequenciais.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.