EXEMPLO: transformações Flatten e Valuestocols

Neste exemplo, mostramos como você pode fazer referência cruzada de colunas de dados usando as seguintes transformações:

  • flatten: nivele os valores de uma matriz em linhas separadas no conjunto de dados. Consulte Transformação Flatten.
  • valuestocols: extraia instâncias únicas de valores em colunas separadas, com um indicador adicionado a cada linha onde está o valor único. Consulte Transformação Valuestocols.

Origem:

Os seguintes dados representam assinaturas de revistas de clientes individuais. As assinaturas são armazenadas em uma matriz de valores. Seu interesse é saber quem está assinando cada revista.

CustIdSubscriptions
Anne Aimes["Little House and Garden","Sporty Pants","Life on the Range"]
Barry Barnes["Sporty Pants","Investing Smart"]
Cindy Compton["Cakes n Pies","Powerlifting Plus","Running Days"]
Darryl Diaz["Investing Smart","Cakes n Pies"]

Transformação:

Quando esses dados são carregados no Transformer, talvez você tenha que aplicar um header a eles. Se estiver no formato CSV, talvez seja necessário aplicar algumas transformações replace para limpar a coluna Subscriptions de modo que se pareça com o exemplo acima.

Quando a coluna Subscriptions contém matrizes com formatação limpa, a coluna é inserida novamente como o tipo Array. Assim, você pode aplicar a transformação flatten:

flatten col:Subscriptions

Cada combinação CustId/Subscription está escrita em uma linha separada. Você pode usar essa nova estrutura de dados para distribuir as instâncias de assinaturas de revistas. Usando a seguinte transformação, você pode adicionar o valor CustId correspondente à coluna:

valuestocols col:Subscriptions value:CustId

Exclua as duas colunas de origem:

drop col:CustId,Subscriptions

Resultados:

Little_House_and_GardenSporty_PantsLife_on_the_RangeInvesting_SmartCakes_n_PiesPowerlifting_PlusRunning_Days
Anne Aimes
Anne Aimes
Anne Aimes
Barry Barnes
Barry Barnes
Cindy Compton
Cindy Compton
Cindy Compton
Darryl Diaz
Darry Diaz
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.