Função SUM

Calcula a soma de todos os valores encontrados em todas as linhas de uma coluna. A coluna de entrada pode ser de Inteiro ou Decimal.
  • Se uma linha contiver um valor ausente ou nulo, não será considerada no cálculo. Se nenhum valor numérico for encontrado na coluna de origem, a função retornará 0.
  • Quando usada em uma transformação pivot, a função é calculada para cada instância do valor especificado no parâmetro group. Veja Transformação Pivot.

Para uma versão dessa função, calculada em uma janela contínua de linhas, veja Função ROLLINGSUM.

Uso básico

pivot value:SUM(myRating) group:postal_code limit:1

Saída: gera uma coluna de duas colunas. Ela contém os valores únicos da coluna postal_code e a soma do grupo de valores da coluna myRating para o valor postal_code. O parâmetro limit define o número máximo de colunas do resultado.

Sintaxe

pivot value:SUM(function_col_ref) [group:group_col_ref] [limit:limit_count]

ArgumentoObrigatório?Tipo de dadosDescrição
function_col_refSstringNome da coluna à qual aplicar a função

Para mais informações sobre os parâmetros group e limit, consulte Transformação Pivot.

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

function_col_ref

Nome da coluna de cujos valores você quer calcular a soma. A coluna precisa conter valores Inteiros ou Decimais.

  • Valores literais não são aceitos como entradas.
  • Não há compatibilidade com várias colunas e caracteres curinga.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimString (referência de coluna)myValues

Exemplos

Este exemplo ilustra as seguintes funções:

  • LIST: extrai até 1.000 valores de uma coluna para uma matriz em uma nova coluna. Consulte Função LIST.
  • LISTUNIQUE: extrai até 1.000 valores exclusivos de uma coluna para uma matriz em uma nova coluna. Consulte Função UNIQUE.

Você tem o seguinte grupo de pedidos para dois meses e gostaria de identificar o grupo de cores que foram vendidas para cada produto por mês e a quantidade total de produtos vendidos por mês.

Fonte:

OrderIdDataItemQuantidadeCor
100115/1/15Calça1vermelho
100215/1/15Camisa2verde
100315/1/15Chapéu3azul
100416/1/15Camisa4amarelo
100516/1/15Chapéu5vermelho
100620/1/15Calça6verde
100715/1/15Chapéu7azul
100815/4/15Camisa8amarelo
100915/4/15Sapatos9marrom
101016/4/15Calça1vermelho
101116/4/15Chapéu2verde
101216/4/15Camisa3azul
101320/4/15Sapatos4preto
101420/4/15Chapéu5azul
101520/4/15Calça6preto

Transformação:

Para rastrear por mês, você precisa de uma coluna que contenha o valor de mês extraído da data:

set col:Date value:DATEFORMAT(Date, 'MMM yyyy')

Use a seguinte transformação para verificar a lista de valores exclusivos entre as cores:

pivot value: LISTUNIQUE(Color, 1000) group: Date limit:10

Datalistunique_Color
Jan 2015["green","blue","red","yellow"]
Abr 2015["brown","blue","red","yellow","black","green"]

Exclua a transformação acima.

Agregue os dados no conjunto, agrupados pelos valores Date reformatados, e aplique a função LIST na coluna Color. Na mesma agregação, é possível incluir uma função de soma para a coluna Qty:

pivot value: LIST(Color, 1000) SUM(Qty) group: Date limit:10

Resultados:

Datalist_Colorsum_Qty
Jan 2015["green","blue","blue","red","green","red","yellow"]28
Abr 2015["brown","blue","red","yellow","black","blue","black","green"] 38

Se necessário, descompacte os dados da matriz da lista usando o seguinte:

unnest col:list_Color

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.