Transformação Aggregate

A transformação aggregate executa cálculos de síntese em um conjunto de valores em uma coluna, conforme agrupado pelos valores em outra coluna.Por exemplo: você pode calcular a média e o desvio padrão dos resultados de testes por aluno, gênero, número da sala de aula ou por todos esses grupos.

  • Nesse caso, todos os outros dados no conjunto são removidos. Você pode adicionar colunas como parte da transformação aggregate.
  • Para mais informações sobre as funções disponíveis, consulte Funções Aggregate.

Uso básico

aggregate value:MAX(totalSales) group: Region

Resultado: reorganiza o conjunto de dados em duas colunas: a nova coluna Region, que contém os valores exclusivos da coluna Region de origem, e a coluna max_totalSales, que contém o valor máximo dos valores na coluna totalSales original para cada valor na Region.

Parâmetros

aggregate value: AGGREGATE_FUNCTION(column_ref) [group: group_col]

TokenObrigatório?Transform BuilderTipo de dadosDescrição
aggregateSAgregar linhastransformNome da transformação
valueSFunçõesstring

Expressão que avalia para a chamada da função aggregate e os parâmetros dela

Consulte Funções Aggregate.

groupNAgrupar porstringNome ou nomes de coluna que contêm os valores pelos quais agrupar para o cálculo

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

value

Na transformação aggregate, o parâmetro value contém a chamada de função e os parâmetros dela, que definem o conjunto de colunas ao qual a função é aplicada.

OBSERVAÇÃO: no parâmetro value, use apenas funções aggregate. Para mais informações, consulte Funções aggregate.

Notas de uso

Obrigatório?Tipo de dados
SimString (expressão que avalia para uma string de valor usando a função aggregate de referência)

group

Na transformação aggregate, este parâmetro especifica a coluna ou as colunas cujos valores são usados para agrupar o conjunto de dados antes de aplicar a função especificada. Você pode especificar vários nomes de colunas como valores separados por vírgula.

Se nenhum parâmetro group for aplicado, a transformação será aplicada em todo o conjunto de dados.

OBSERVAÇÃO: tenha cuidado ao aplicar essa transformação em grupos que contêm um grande número de linhas exclusivas. Em alguns casos, o aplicativo pode ficar sem memória ao gerar resultados e os resultados podem apresentar falha.

Observações sobre o uso:

Obrigatório?Tipo de dados
NãoString (nome da coluna)

Exemplos

Consulte as funções individuais de exemplo. Consulte Funções Aggregate.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.