Função AVERAGE

Computa a média de todos os valores de linha em uma coluna. A coluna de entrada pode ser de inteiro ou decimal.

  • Se uma linha contiver um valor ausente ou nulo, ela não será considerada no cálculo. Se a coluna inteira não contiver valores, a função retornará um valor nulo.
  • Quando usada em uma transformação aggregate, a função é calculada para cada instância do valor especificado no parâmetro group. Consulte Transformação Aggregate.

Uso básico

aggregate value:AVERAGE(myRating) group:postal_code

Resultado: gera uma tabela de duas colunas que contém os valores exclusivos da coluna postal_code e a média dos valores na coluna myRating para o valor postal_code.

Sintaxe

aggregate value:AVERAGE(function_col_ref) [group:group_col_ref]

ArgumentoObrigatório?Tipo de dadoDescrição
function_col_refSstringNome da coluna à qual aplicar a função

Para mais informações sobre o parâmetro group, consulte Transformação Aggregate.

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

function_col_ref

Nome da coluna com base nos valores que você quer calcular a média. A coluna precisa conter valores inteiros ou decimais.

  • Valores literais não são aceitos como entradas.
  • Não há compatibilidade com várias colunas e caracteres curinga.

Observações de uso:

Obrigatório?Tipo de dadoValor do exemplo
SimString (referência de coluna)myValues

Exemplos

Exemplo: estatísticas sobre pontuações de teste

Este exemplo ilustra como você pode aplicar funções estatísticas ao conjunto de dados. Os cálculos incluem média, máxima, mínima, desvio padrão e variância.

Origem:

Os alunos fizeram um teste e registraram as seguintes pontuações. Você quer realizar algumas análises estatísticas sobre eles:

EstudantePontuação
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe86
Hannah99
Ian73
Jane68

Transformação:

Use as transformações abaixo para calcular as pontuações médias, mínimas e máximas:

derive value:AVERAGE(Score) as:'avgScore'

derive value:MIN(Score) as:'minScore'

derive value:MAX(Score) as:'maxScore'

Para aplicar funções estatísticas aos dados, use as funções VAR e STDEV, que também podem ser usadas como base para outros cálculos estatísticos.

derive value:VAR(Score)

derive value:STDEV(Score)

Para calcular a variação de cada pontuação a partir da média, use o comando a seguir:

derive value:((Score - average_Score) / stdev_Score) as:'stDevs'

Agora, aplique notas com base em uma fórmula:

Notadesvios padrão da média (stDevs)
AstDevs > 1
BstDevs > 0,5
C-1 <= stDevs <= 0,5
DstDevs < -1
FstDevs < -2

Crie a seguinte transformação usando a função if para calcular notas.

derive value:IF((stDevs > 1),'A',IF((stDevs < -2),'F',IF((stDevs < -1),'D',IF((stDevs > 0.5),'B','C'))))

Para mais informações, consulte Função IF.

Para limpar o conteúdo, convém aplicar uma formatação às colunas de pontuação. A instrução abaixo reformata as colunas stdev_Score e stDevs para exibir duas casas decimais:

set col:stdev_Score value:NUMFORMAT(stdev_Score, '##.00')

set col:stDevs value:NUMFORMAT(stDevs, '##.00')

Resultados:

EstudantePontuaçãoavgScoreminScoremaxScorevar_Scorestdev_ScorestDevsNota
Anna8482,16899

87,69000000000142

9,360,20C
Ben7182,1689987,690000000001429,36-1,19D
Caleb7682,1689987,690000000001429,36-0,65C
Danielle8782,1689987,690000000001429,360,52B
Evan8582,1689987,690000000001429,360,31C
Faith9282,1689987,690000000001429,361,06A
Gabe8682,1689987,690000000001429,360,42C
Hannah9982,1689987,690000000001429,361,80A
Ian7382,1689987,690000000001429,36-0,97C
Jane6882,1689987,690000000001429,36-1,51D

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.