Adicionar cabeçalhos às colunas

Uma coluna é referenciada pelo nome inferido na primeira linha de dados no seu conjunto de dados.

Quando um conjunto de dados é carregado, o aplicativo insere algumas etapas de transformação automaticamente. Se o aplicativo puder identificar que a primeira linha de dados provavelmente contém os cabeçalhos das colunas do conjunto de dados, essa linha será promovida para ser usada como a primeira versão dos nomes de cada coluna.

No entanto, em alguns casos, essa geração automática de cabeçalhos de coluna tende a não funcionar conforme esperado, ou talvez, no momento da importação, você tenha optado por não detectar a estrutura do conjunto de dados.

Nesta seção descrevemos como você pode gerar cabeçalhos de coluna dentro do aplicativo.

Se os dados tiverem uma linha de cabeçalho na linha 1

Se as transformações iniciais não promoverem a primeira linha de dados para ser o cabeçalho das colunas, você poderá usar a seguinte transformação para promover a primeira linha de dados para ser o cabeçalho das colunas:

Nome da transformação Rename columns with a row
Parâmetro: opção Use row as header
Parâmetro: linha 1

Em alguns casos, a primeira linha de dados pode não conter os cabeçalhos ou não conter todos.

Por exemplo, você pode ter algumas colunas que contenham dados aninhados, e os cabeçalhos das colunas podem não ser acessíveis imediatamente.

Dica: depois que você desaninhar dados em uma ou mais colunas, a primeira linha poderá conter cabeçalhos de coluna. Aplique a transformação de header para promover esses novos valores a nomes das colunas. Os outros cabeçalhos das colunas não precisam ser substituídos.

Se os dados tiverem uma linha de cabeçalho depois da linha 1

Em alguns casos, os dados podem ser importados de maneira que as informações do cabeçalho sejam armazenadas em uma linha diferente da primeira no conjunto de dados.

OBSERVAÇÃO: se a informação do número da linha de origem não estiver mais disponível devido a alterações no conjunto de dados, é possível que essa transformação não esteja disponível.

Passos:

  1. Passe o mouse sobre o ponto preto à esquerda da linha que contém as informações de cabeçalho. O menu pop-up exibe algo semelhante a isto:

    Row 12
    Source Row 12
  2. Adicione uma etapa de transformação usando o número da linha de origem que você localizou:

    Nome da transformação Rename columns with a row
    Parâmetro: opção Use row as header
    Parâmetro: linha 12
  3. Adicione-a à receita.
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.