Transformação Header

OBSERVAÇÃO: as transformações fazem parte da linguagem subjacente não diretamente acessível aos usuários. Esse conteúdo é mantido apenas para fins de referência.

Usa uma linha da amostra do conjunto de dados como a linha de cabeçalho da tabela. Cada valor nessa linha torna-se o nome da coluna em que ele está localizado.

Essa transformação pode ser aplicada automaticamente como uma das primeiras etapas da receita. Veja Etapas de análise inicial.

OBSERVAÇÃO: se a informação do número da linha de origem não estiver mais disponível devido a alterações no conjunto de dados, é possível que essa transformação não esteja disponível.

Uso básico

header sourcerownumber: 4

Saída: os valores da linha nº 4 do conjunto de dados original são usados, se disponíveis, como nomes para cada coluna. Se a linha não estiver disponível, os dados da linha especificados poderão ser recuperados e a transformação falhará.

Parâmetros

header sourcerownumber: row_num

TokenObrigatório?Tipo de dadosDescrição
headerStransformaçãoNome da transformação
sourcerownumberSinteiro (positivo)Número de linha dos dados originais a serem usados como o cabeçalho.

Para saber mais informações sobre padrões de sintaxe, consulte Observações de sintaxe da documentação do idioma.

sourcerownumber

O parâmetro sourcerownumber define o número da linha a ser aplicado à etapa da transformação.

Este parâmetro faz referência ao número da linha original da amostra no conjunto de dados.

  • O parâmetro sourceownumber precisa ser um número inteiro que seja menor que ou igual ao número total de linhas na amostra original.
  • Se a linha correspondente tiver sido excluída do conjunto de dados, a etapa de transformação vai gerar um erro.

Exemplo:

header sourcerownumber: 4

Saída: usa a linha nº 4 a partir dos números da linha de origem da amostra como o cabeçalho das colunas.

Observações de uso:

Obrigatório?Tipo de dados
Siminteiro (positivo)

Exemplos

Exemplo: cabeçalho da linha que não é a primeira

Origem:

Você importou de um arquivo CSV os seguintes dados sobre os tempos de classificação de corredores. Quando são carregados na página "Transformer", eles ficam assim:

(rowId)coluna2column3column4coluna5
1CorredorClassificatória 1Classificatória 2Classificatória 3
2Corredor X37,2238,2237,61
3Corredor Y41,33DQ38,04
4Corredor Z39,2739,0438,85

No exemplo acima, a coluna (rowId) se refere aos números de linha exibidos na grade de dados. Ela não faz parte do conjunto de dados. Essa informação está disponível quando você passa o cursor do mouse sobre o ponto preto no lado esquerdo da tela.

Transformação

Você avaliou o melhor desempenho em cada classificatória de acordo com a amostra. Você percebeu que os dados contêm cabeçalhos, mas não se lembra de como foram originalmente classificados. Os dados agora ficam assim:

(rowId)coluna2column3column4coluna5
1Corredor Y41,33DQ38,04
2CorredorClassificatória 1Classificatória 2Classificatória 3
3Corredor X37,2238,2237,61
4Corredor Z39,2739,0438,85

É possível desfazer as etapas de classificação para retornar à ordem de classificação original. No entanto, essa abordagem funciona melhor se você não incluir entre elas outras etapas baseadas na ordem de classificação.

Resultados:

Após a aplicação da última transformação header, os dados ficam assim:

(rowId)CorredorClassificatória_1Classificatória_2Classificatória_3
3Corredor Y41,33DQ38,04
2Corredor X37,2238,2237,61
4Corredor Z39,2739,0438,85

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.