Função VAR

Computa a variância dentre todos os valores em uma coluna. A coluna de entrada pode ter números Inteiros ou Decimais. Se nenhum valor numérico for detectado na coluna de entrada, a função retornará 0. A variância de um conjunto de valores tenta medir a propagação em valores em torno da média. Uma variância de zero significa que todos os valores são os mesmos, e uma variância pequena significa que os valores estão agrupados com total proximidade. Um valor alto de variância indica que os números estão amplamente espalhados. A diferença é sempre um valor positivo.

Var(X) = [Soma ((X - média(X))2)] / Contagem(X)

Há dois tipos de variância: de preenchimento e de amostra.

  • A variância de preenchimento calcula a variância de todos os valores possíveis.
  • A variância de amostra é calculada com base em um subconjunto ou amostra de todos os valores.
  • Como o Cloud Dataprep tem acesso a todos os valores disponíveis, a computação para a variância de preenchimento é usada em todo o conjunto de dados.

A raiz quadrada da variância é o desvio padrão, que é usado para medir a variância sob a hipótese de uma distribuição de curva do sino. Consulte Função STDEV.

Se uma linha contiver um valor ausente ou nulo, ela não será considerada no cálculo.

Uso básico

aggregate value:VAR(myRating) group:postal_code

Resultado: gera uma nova tabela que contém os valores exclusivos da coluna postal_code e a variância do grupo de valores da coluna myRating para o valor postal_code.

Sintaxe

aggregate value:VAR(function_col_ref) [group:group_col_ref]

ArgumentoObrigatório?Tipo de dadoDescrição
function_col_refSstringNome da coluna à qual aplicar a função

Para mais informações sobre o parâmetro group, consulte Transformação Aggregate.

Para mais informações sobre os padrões de sintaxe, consulte Notas de sintaxe da documentação da linguagem.

function_col_ref

Nome da coluna cujos valores você quer calcular a variância. A coluna precisa conter valores Inteiros ou Decimais.

  • Valores literais não são aceitos como entradas.
  • Não há compatibilidade com várias colunas e caracteres curinga.

Observações de uso:

Obrigatório?Tipo de dadoValor do exemplo
SimString (referência de coluna)myValues

Exemplos

Este exemplo ilustra como você pode aplicar funções estatísticas ao seu conjunto de dados. Os cálculos incluem média, máxima, mínima, desvio padrão e variância.

Origem:

Os alunos fizeram um teste e registraram as seguintes pontuações. Você quer realizar algumas análises estatísticas sobre eles:

EstudantePontuação
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe86
Hannah99
Ian73
Jane68

Transformação:

Para calcular as pontuações médias, mínimas e máximas, use as transformações abaixo:

derive value:AVERAGE(Score) as:'avgScore'

derive value:MIN(Score) as:'minScore'

derive value:MAX(Score) as:'maxScore'

Para aplicar funções estatísticas aos seus dados, use as funções VAR e STDEV como base para outros cálculos estatísticos.

derive value:VAR(Score)

derive value:STDEV(Score)

Para calcular as variações de cada pontuação da média, use o comando a seguir:

derive value:((Score - average_Score) / stdev_Score) as:'stDevs'

Agora, aplique notas com base em uma fórmula:

Notadesvios padrão da média (stDevs)
AstDevs > 1
BstDevs > 0,5
C-1 <= stDevs <= 0,5
DstDevs < -1
FstDevs < -2

Você pode criar a transformação abaixo usando a função if para calcular notas.

derive value:IF((stDevs > 1),'A',IF((stDevs < -2),'F',IF((stDevs < -1),'D',IF((stDevs > 0.5),'B','C'))))

Para mais informações, consulte Função IF.

Para limpar o conteúdo, é recomendável aplicar uma formatação às colunas de pontuação. Com as funções a seguir, as colunas stdev_Score e stDevs são reformatadas para que exibam duas casas decimais:

set col:stdev_Score value:NUMFORMAT(stdev_Score, '##.00')

set col:stDevs value:NUMFORMAT(stDevs, '##.00')

Resultados:

EstudantePontuaçãoavgScoreminScoremaxScorevar_Scorestdev_ScorestDevsNota
Anna8482,16899

87,69000000000142

9,360,20C
Ben7182,1689987,690000000001429,36-1,19D
Caleb7682,1689987,690000000001429,36-0,65C
Danielle8782,1689987,690000000001429,360,52B
Evan8582,1689987,690000000001429,360,31C
Faith9282,1689987,690000000001429,361,06A
Gabe8682,1689987,690000000001429,360,42C
Hannah9982,1689987,690000000001429,361,80A
Ian7382,1689987,690000000001429,36-0,97C
Jane6882,1689987,690000000001429,36-1,51D

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.