Dados Pivot

Uma tabela dinâmica resume dados originados de outra tabela. Usando tabelas dinâmicas, calcule funções de agregação, como somas, máximos e médias de uma ou mais colunas de dados. Essas somas podem ser realizadas em vários grupos de valores de uma coluna e divididas em colunas com base nos valores de outra. No Cloud Dataprep by TRIFACTA® INC., uma tabela dinâmica é composta pelos seguintes elementos básicos:

Elemento da tabela dinâmicaDescrição
Rótulos de colunaLista de uma ou mais colunas com valores que são representados como as colunas na tabela dinâmica gerada.
Rótulos de linhaLista de uma ou mais colunas com valores que se tornam as linhas na tabela dinâmica gerada.
Valores

Também conhecidos como fatos, esses valores são uma ou mais fórmulas de agregação, calculadas da seguinte maneira:

"Mostre-me o valor dessa fórmula calculada por valor de linha para cada valor representado na tabela gerada."

OBSERVAÇÃO: se a agregação não incluir o tipo de transformação listado acima, em que os dados são transformados de linhas em colunas, será possível usar a transformação Agrupar por. Consulte Criar agregações.

Como criar uma tabela dinâmica

As tabelas dinâmicas são ferramentas muito eficientes para resumir e visualizar volumes de dados em larga escala. No Cloud Dataprep by TRIFACTA INC., procure pivot table no painel "Pesquisar" para criar uma.

OBSERVAÇÃO: uma tabela dinâmica substitui totalmente a tabela de origem. Os dados não capturados na definição dinâmica são perdidos.

Nos fluxos, pode ser útil criar as tabelas dinâmicas em receitas independentes encadeadas da receita principal. Para saber mais informações, consulte Criar saídas de branch.

Dados de exemplo

É possível que as tabelas dinâmicas sejam mais bem explicadas com exemplo. O snippet de tabela a seguir captura dados transacionais de um número de lojas de um intervalo de produtos em um conjunto de datas. Os valores transacionais incluem o total de vendas, a quantidade e o custo (POS_Sales, POS_Qty e POS_Cost):

DailyStore_NbrPOS_SalesPOS_QtyPOS_CostPRODUCT_DESC
8/2/1317074,97ACME LAWN GARDEN BAG CLEAR
7/2/13210,6298,37ACME COOKIES CHOC CHIP
7/2/132000ACME SANDWICH BAG
7/2/1327,0865,58ACME SODAS SALTED
7/2/1323,9222,82ACME SCENTED OIL REFILL-CTRY SUN
7/2/13213,44710,36ACME LARGE FUDGE GRAHAMS COOKIES
7/2/132000ACME SUGAR ICE WAFERS VANILLA
7/2/1333,1622,86ACME ZOO ANIMAL FRUIT SNACKS 6'S
7/2/1333,1622,78ACME WAFERS SUGER ICE
7/2/1333,1622,82ACME SCENTED OIL REFILL-CTRY SUN
7/2/1336,3245,92ACME RICE CRACKERS ONION
2/2/1391503016,2ACME FROSTED OATMEAL COOKIE SQUA
2/2/1393,524,86ACME FRUIT SNACK CASTLE ADVENTRS
2/2/1399098,37ACME COOKIES CHOC CHIP
2/2/1393063,24ACME ASSORTED COOKIES DRP
2/2/1397076,51ACME KITCHEN BAG
2/2/1391701715,81ACME SNACK BAGS RESEALABLE
2/2/1392042,16ACME CHEDDARY SN CRACKERS/PROCES
2/2/1396,528,98ACME RICE CRACKERS TERIYAKI
2/2/1391,531,62ACME COOKIE MAPLE LEAF CREME
2/2/1393063,24ACME RICE CHIPS CHEDDAR
1/2/1371903820,52ACME FROSTED OATMEAL COOKIE SQUA
1/2/1372021,86ACME COOKIES CHOC CHIP
1/2/1371010,82ACME DIGESTIVE RICH TEA BISCUITS
1/2/1371202412,96ACME ASSORTED COOKIES DRP
1/2/1371201211,16ACME KITCHEN BAG
1/2/1379098,37ACME SNACK BAGS RESEALABLE
1/2/1371010,71ACME FUDGE MINT COOKIES SQUARES
1/2/1379,51910,26ACME CHEDDARY SN CRACKERS/PROCES
1/2/1371010,82ACME COOKIES MAPLE CREAM
1/2/1374084,32ACME COOKIE MAPLE LEAF CREME

Agregações disponíveis

A transformação de dados dinâmicos aceita o uso de qualquer função de agregação. Para saber mais informações, consulte Funções de agregação.

Tabela dinâmica simples

Considerando o exposto acima, suponhamos que você tenha interesse nas vendas de cada loja para cada produto. Use a seguinte transformação para calcular esses cálculos agregados:

Nome da transformação Pivot table
Parâmetro: rótulos da coluna Store_Nbr
Parâmetro: rótulos da linha PRODUCT_DESC
Parâmetro: valores SUM(POS_Sales)
Parâmetro: número máximo de colunas a serem criadas 500

Na transformação acima:

  • A entrada de rótulos Coluna especifica a coluna com valores que compõem as colunas calculadas da tabela dinâmica. O cálculo é realizado em cada um desses valores. Nesse caso, cada coluna contém cálculos para números de loja separados.
  • A entrada de rótulos Linha especifica a coluna com valores que definem o agrupamento dos cálculos. Nesse caso, a soma da coluna de vendas é realizada para cada valor de descrição do produto de cada loja.
  • A entrada Valores especifica a função de agregação a ser computada para cada célula na nova tabela. Nesse caso, você está gerando a soma de vendas para cada descrição de produto em cada loja.
  • Por padrão, essa transformação gera um máximo de 50 colunas novas. No entanto, se a coluna usada nos rótulos Coluna contiver mais de 50 valores, convém aumentar esse valor.

    OBSERVAÇÃO: evite criar conjuntos de dados com mais de 2.500 colunas. Conjuntos de dados muito amplos podem causar degradação no desempenho.

Resultados:

PRODUCT_DESCsum_POS_Sales_1sum_POS_Sales_2sum_POS_Sales_3sum_POS_Sales_7sum_POS_Sales_9
ACME LAWN GARDEN BAG CLEAR700000
ACME COOKIES CHOC CHIP010,6202090
ACME SANDWICH BAG00000
ACME SODAS SALTED07,08000
ACME SCENTED OIL REFILL-CTRY SUN03,923,1600
ACME LARGE FUDGE GRAHAMS COOKIES013,44000
ACME SUGAR ICE WAFERS VANILLA00000
ACME ZOO ANIMAL FRUIT SNACKS 6'S003,1600
ACME WAFERS SUGER ICE003,1600
ACME RICE CRACKERS ONION006,3200
ACME FROSTED OATMEAL COOKIE SQUA000190150
ACME FRUIT SNACK CASTLE ADVENTRS00003,5
ACME ASSORTED COOKIES DRP00012030
ACME KITCHEN BAG00012070
ACME SNACK BAGS RESEALABLE00090170
ACME CHEDDARY SN CRACKERS/PROCES0009,520
ACME RICE CRACKERS TERIYAKI00006,5
ACME COOKIE MAPLE LEAF CREME000401,5
ACME RICE CHIPS CHEDDAR000030
ACME DIGESTIVE RICH TEA BISCUITS000100
ACME FUDGE MINT COOKIES SQUARES000100
ACME COOKIES MAPLE CREAM000100

Agregações condicionais

Suponhamos que você esteja interessado apenas na soma de vendas para os números de loja 1-3. Para capturar um conjunto de dados mais limitado, use a função de agregação SUMIF:

Nome da transformação Pivot table
Parâmetro: rótulos da coluna Store_Nbr
Parâmetro: rótulos da linha PRODUCT_DESC
Parâmetro: valores SUMIF(POS_Sales, Store_Nbr<4)
Parâmetro: número máximo de colunas a serem criadas 500

A maioria das funções de agregação tem uma variante (*IF) condicional. Consulte Funções aggregate.

Vários níveis de agregação

Nenhum dos eixos de uma tabela dinâmica está limitado a uma única dimensão. É possível ter vários rótulos de coluna, de linha e valores (fórmulas). Na transformação a seguir, as agregações foram divididas por data, e uma fórmula adicional (Valor) foi incluída.

OBSERVAÇÃO: adicionar vários rótulos e valores de coluna pode expandir bastante a largura do conjunto de dados. Normalmente, adicionar rótulos de linha não expande a contagem total de linhas.

Nome da transformação Pivot table
Parâmetro: rótulos da coluna Store_Nbr
Parâmetro: rótulos da linha 1 Date
Parâmetro: rótulos da linha 2 PRODUCT_DESC
Parâmetro: valores 1 SUM(POS_Qty)
Parâmetro: valores 2 SUM(POS_Sales)
Parâmetro: número máximo de colunas a serem criadas 500

Resultados:

OBSERVAÇÃO: a tabela de resultados a seguir está incompleta. Algumas colunas foram omitidas por motivos de espaço.

DailyPRODUCT_DESCsum_POS_Qty_1sum_POS_Sales_1sum_POS_Qty_2sum_POS_Sales_2sum_POS_Qty_3sum_POS_Sales_3
8/2/13ACME LAWN GARDEN BAG CLEAR7700000
7/2/13ACME COOKIES CHOC CHIP00910,6200
7/2/13ACME SANDWICH BAG000000
7/2/13ACME SODAS SALTED0067,0800
7/2/13ACME SCENTED OIL REFILL-CTRY SUN0023,9223,16
7/2/13ACME LARGE FUDGE GRAHAMS COOKIES00713,4400
7/2/13ACME SUGAR ICE WAFERS VANILLA000000
7/2/13ACME ZOO ANIMAL FRUIT SNACKS 6'S000023,16
7/2/13ACME WAFERS SUGER ICE000023,16
7/2/13ACME RICE CRACKERS ONION000046,32
2/2/13ACME FROSTED OATMEAL COOKIE SQUA000000
2/2/13ACME FRUIT SNACK CASTLE ADVENTRS000000
2/2/13ACME COOKIES CHOC CHIP000000
2/2/13ACME ASSORTED COOKIES DRP000000
2/2/13ACME KITCHEN BAG000000
2/2/13ACME SNACK BAGS RESEALABLE000000
2/2/13ACME CHEDDARY SN CRACKERS/PROCES000000
2/2/13ACME RICE CRACKERS TERIYAKI000000
2/2/13ACME COOKIE MAPLE LEAF CREME000000
2/2/13ACME RICE CHIPS CHEDDAR000000
1/2/13ACME FROSTED OATMEAL COOKIE SQUA000000
1/2/13ACME COOKIES CHOC CHIP000000
1/2/13ACME DIGESTIVE RICH TEA BISCUITS000000
1/2/13ACME ASSORTED COOKIES DRP000000
1/2/13ACME KITCHEN BAG000000
1/2/13ACME SNACK BAGS RESEALABLE000000
1/2/13ACME FUDGE MINT COOKIES SQUARES000000
1/2/13ACME CHEDDARY SN CRACKERS/PROCES000000
1/2/13ACME COOKIES MAPLE CREAM000000
1/2/13ACME COOKIE MAPLE LEAF CREME000000

Agrupar por

Se quiser manter os valores do conjunto de dados original, será possível realizar cálculos de agregação em uma única coluna. Para saber mais informações, consulte Criar agregações.

Valores para colunas

Semelhantes a tabelas dinâmicas, os valores de conversão para colunas informações de colunas convertem valores individuais em colunas independentes no conjunto de dados. Para cada linha, se o valor representado pela coluna estiver presente nos dados originais, um valor será adicionado (por exemplo, Yes). Se estiver faltando, outro valor será inserido (por exemplo, No).

Dica: esse tipo de conversão pode ser útil para preparar dados para sistemas de machine learning. É possível converter a presença ou a ausência de valores específicos em uma linha em 1 ou 0, respectivamente.

Os seguintes valores na coluna Store_Nbr foram convertidos em colunas individuais:

Nome da transformação Convert values to columns
Parâmetro: coluna Store_Nbr
Parâmetro: preencher quando presente Yes
Parâmetro: número máximo de colunas a serem criadas 250

Acima:

  • Preencher quando presente identifica o valor literal da string a ser inserido se a linha contiver o valor da coluna (Yes).
  • Preencher quando ausente identifica o valor literal da string a ser inserido se a linha não contiver o valor da coluna (vazio).
  • O número máximo de colunas a serem criadas estabelece um limite quanto ao número total de colunas que o aplicativo pode criar. Nesse caso, o limite é definido como 250 porque o número conhecido de lojas é 250.

    Dica: é um bom hábito definir limites para o número máximo de colunas a serem criadas. Os dados poderão se tornar esparsos ou difíceis de gerenciar se os limites não forem considerados.

Resultados:

DailyStore_NbrPOS_SalesPOS_QtyPOS_CostPRODUCT_DESCcolumn_1column_2column_3column_9column_7
8/2/1317074,97ACME LAWN GARDEN BAG CLEARSim
7/2/13210,6298,37ACME COOKIES CHOC CHIP Sim
7/2/132000ACME SANDWICH BAG Sim
7/2/1327,0865,58ACME SODAS SALTED Sim
7/2/1323,9222,82ACME SCENTED OIL REFILL-CTRY SUN Sim
7/2/13213,44710,36ACME LARGE FUDGE GRAHAMS COOKIES Sim
7/2/132000ACME SUGAR ICE WAFERS VANILLA Sim
7/2/1333,1622,86ACME ZOO ANIMAL FRUIT SNACKS 6'S Sim
7/2/1333,1622,78ACME WAFERS SUGER ICE Sim
7/2/1333,1622,82ACME SCENTED OIL REFILL-CTRY SUN Sim
7/2/1336,3245,92ACME RICE CRACKERS ONION Sim
2/2/1391503016,2ACME FROSTED OATMEAL COOKIE SQUA Sim
2/2/1393,524,86ACME FRUIT SNACK CASTLE ADVENTRS Sim
2/2/1399098,37ACME COOKIES CHOC CHIP Sim
2/2/1393063,24ACME ASSORTED COOKIES DRP Sim
2/2/1397076,51ACME KITCHEN BAG Sim
2/2/1391701715,81ACME SNACK BAGS RESEALABLE Sim
2/2/1392042,16ACME CHEDDARY SN CRACKERS/PROCES Sim
2/2/1396,528,98ACME RICE CRACKERS TERIYAKI Sim
2/2/1391,531,62ACME COOKIE MAPLE LEAF CREME Sim
2/2/1393063,24ACME RICE CHIPS CHEDDAR Sim
1/2/1371903820,52ACME FROSTED OATMEAL COOKIE SQUA Sim
1/2/1372021,86ACME COOKIES CHOC CHIP Sim
1/2/1371010,82ACME DIGESTIVE RICH TEA BISCUITS Sim
1/2/1371202412,96ACME ASSORTED COOKIES DRP Sim
1/2/1371201211,16ACME KITCHEN BAG Sim
1/2/1379098,37ACME SNACK BAGS RESEALABLE Sim
1/2/1371010,71ACME FUDGE MINT COOKIES SQUARES Sim
1/2/1379,51910,26ACME CHEDDARY SN CRACKERS/PROCES Sim
1/2/1371010,82ACME COOKIES MAPLE CREAM Sim
1/2/1374084,32ACME COOKIE MAPLE LEAF CREME Sim
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.