EXEMPLO: funções estatísticas

Neste exemplo, ilustramos como você pode aplicar funções estatísticas ao conjunto de dados. Os cálculos incluem média, máxima, mínima, desvio padrão e variância.

Fonte:

Os alunos fizeram um teste e registraram as seguintes pontuações. Você quer realizar algumas análises estatísticas sobre eles:

StudentScore
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe85
Hannah99
Ian73
Jane68

Transformação:

Para calcular as pontuações médias, mínimas e máximas, use as transformações abaixo:

derive type:single value:AVERAGE(Score) as:'avgScore'

derive type:single value:MIN(Score) as:'minScore'

derive type:single value:MAX(Score) as:'maxScore'

Para aplicar funções estatísticas aos seus dados, use as funções VAR e STDEV como base para outros cálculos estatísticos.

derive type:single value:VAR(Score)

derive type:single value:STDEV(Score)

Para calcular as variações de cada pontuação com base na média, use o comando a seguir:

derive type:single value:((Score - avg_Score) / stdev_Score) as:'stDevs'

Agora, aplique notas com base em uma fórmula:

Notadesvios padrão da média (stDevs)
AstDevs > 1
BstDevs > 0.5
C-1 <= stDevs <= 0.5
DstDevs < -1
FstDevs < -2

Você pode criar a transformação abaixo usando a função IF para calcular notas.

derive type:single value:IF((stDevs > 1),'A',IF((stDevs < -2),'F',IF((stDevs < -1),'D',IF((stDevs > 0.5),'B','C'))))

Para mais informações, consulte Função IF.

Para limpar o conteúdo, é recomendável aplicar uma formatação às colunas de pontuação. Com as funções a seguir, as colunas stdev_Score e stDevs são reformatadas para que exibam duas casas decimais:

set col:stdev_Score value:NUMFORMAT(stdev_Score, '##.00')

set col:stDevs value:NUMFORMAT(stDevs, '##.00')

derive type:single value:MODE(Score) as:'modeScore'

Resultados:

StudentScoremodeScoreavgScoreminScoremaxScorevar_Scorestdev_ScorestDevsGrade
Anna8485826899

87.00000000000001

9.330.21C
Ben718582689987.000000000000019.33-1.18D
Caleb768582689987.000000000000019.33-0.64C
Danielle878582689987.000000000000019.330.54B
Evan858582689987.000000000000019.330.32C
Faith928582689987.000000000000019.331.07A
Gabe858582689987.000000000000019.330.32C
Hannah998582689987.000000000000019.331.82A
Ian738582689987.000000000000019.33-0.96C
Jane688582689987.000000000000019.33-1.50D
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.