Função STDEV

Calcula o desvio padrão em todos os valores das colunas de tipo de Números inteiros ou Decimais.

O desvio padrão de um conjunto de valores tenta medir a propagação em valores em torno da média e é usado para medir a confiança nos resultados estatísticos. Um desvio padrão de zero significa que todos os valores são os mesmos, e um pequeno desvio padrão significa que os valores estão agrupados bem próximos. Um valor alto de desvio padrão indica que os números estão bem espalhados. O desvio padrão é sempre um valor positivo.

O desvio padrão é dividido em dois tipos:

  • O desvio padrão da população calcula a variância de todos os valores possíveis.
  • O desvio padrão da amostra faz cálculos em um subconjunto ou uma amostra de todos os valores.
  • Como o Cloud Dataprep by TRIFACTA® tem acesso a todos os valores disponíveis, o cálculo do desvio padrão da população é usado em todo o conjunto de dados.

Se uma linha contiver um valor ausente ou nulo, não será considerada no cálculo. Se nenhum valor numérico for detectado na coluna de entrada, a função retornará 0.

O quadrado do desvio padrão é a variância. Consulte Função VAR.

Para uma versão dessa função, calculada em uma janela contínua de linhas, veja ROLLINGSTDEV Function.

Uso básico

pivot value:STDEV(myRating) group: postal_code limit:1

Resultado: é gerada uma tabela de duas colunas que contém os valores únicos da coluna postal_code e o desvio padrão do grupo de valores da coluna myRating para o valor postal_code. O parâmetro limit define o número máximo de colunas de resultado.

Sintaxe

pivot value:STDEV(function_col_ref) [group:group_col_ref] [limit:limit_count]

ArgumentoObrigatório?Tipo de dadosDescrição
function_col_refSstringNome da coluna à qual aplicar a função

Para mais informações sobre os parâmetros group e limit, consulte Transformação Pivot.

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

function_col_ref

Nome da coluna cujos valores você quer calcular a variância. A coluna precisa conter valores Inteiros ou Decimais.

  • Valores literais não são aceitos como entradas.
  • Não há compatibilidade com várias colunas e caracteres curinga.

Observações sobre o uso:

Obrigatório?Tipo de dadosValor de exemplo
SimString (referência de coluna)myValues

Exemplos

Este exemplo ilustra como você pode aplicar funções estatísticas ao seu conjunto de dados. Os cálculos incluem média, máxima, mínima, desvio padrão e variância.

Fonte:

Os alunos fizeram um teste e registraram as seguintes pontuações. Você quer realizar algumas análises estatísticas sobre eles:

StudentScore
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe85
Hannah99
Ian73
Jane68

Transformação:

Para calcular as pontuações médias, mínimas e máximas, use as transformações abaixo:

derive type:single value:AVERAGE(Score) as:'avgScore'

derive type:single value:MIN(Score) as:'minScore'

derive type:single value:MAX(Score) as:'maxScore'

Para aplicar funções estatísticas aos seus dados, use as funções VAR e STDEV como base para outros cálculos estatísticos.

derive type:single value:VAR(Score)

derive type:single value:STDEV(Score)

Para calcular as variações de cada pontuação com base na média, use o comando a seguir:

derive type:single value:((Score - avg_Score) / stdev_Score) as:'stDevs'

Agora, aplique notas com base em uma fórmula:

Notadesvios padrão da média (stDevs)
AstDevs > 1
BstDevs > 0,5
C-1 <= stDevs <= 0,5
DstDevs < -1
FstDevs < -2

Você pode criar a transformação abaixo usando a função IF para calcular notas.

derive type:single value:IF((stDevs > 1),'A',IF((stDevs < -2),'F',IF((stDevs < -1),'D',IF((stDevs > 0.5),'B','C'))))

Para mais informações, consulte Função IF.

Para limpar o conteúdo, é recomendável aplicar uma formatação às colunas de pontuação. Com as funções a seguir, as colunas stdev_Score e stDevs são reformatadas para que exibam duas casas decimais:

set col:stdev_Score value:NUMFORMAT(stdev_Score, '##.00')

set col:stDevs value:NUMFORMAT(stDevs, '##.00')

derive type:single value:MODE(Score) as:'modeScore'

Resultados:

StudentScoremodeScoreavgScoreminScoremaxScorevar_Scorestdev_ScorestDevsGrade
Anna8485826899

87.00000000000001

9.330.21C
Ben718582689987.000000000000019.33-1.18D
Caleb768582689987.000000000000019.33-0.64C
Danielle878582689987.000000000000019.330.54B
Evan858582689987.000000000000019.330.32C
Faith928582689987.000000000000019.331.07A
Gabe858582689987.000000000000019.330.32C
Hannah998582689987.000000000000019.331.82A
Ian738582689987.000000000000019.33-0.96C
Jane688582689987.000000000000019.33-1.50D

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.