VAR 函式

計算資料欄內所有值的變異數。輸入資料欄可以是整數或小數。如果在輸入資料欄中沒有偵測到任何數字值,則函式會傳回 0

一組值的變異數會嘗試測量均值周圍值的差異。變異數為 0 意味著所有值都相同,而變異數不大則代表這些值緊密地聚集在一起。較大的變異數則代表數字廣泛分佈。變異數一律是正值。

Var(X) = [Sum ((X - mean(X))2)] / Count(X)

變異數分為母體變異數和樣本變異數。

  • 母體變異數會計算所有可能值的變異數。
  • 樣本變異數則是計算所有值的子集或是樣本。
  • Since Cloud Dataprep by TRIFACTA® 可存取所有可用的值,母體變異數的計算會採用整個資料集的內容。

變異數的平方根是標準差,用在鐘形曲線分佈的假設下測量變異數。請參閱 STDEV 函式一文。

如果資料列含有遺漏值或空值,則不會列入計算。

如需此函式針對資料列累計範圍計算的版本,請參閱 ROLLINGVAR 函式

基本用法

pivot value:VAR(myRating) group:postal_code limit:1

輸出:產生新的資料表,其中含有 postal_code 資料欄的不重複值,以及 postal_codemyRating 資料欄的群組值變異數。limit 參數會定義輸出資料欄數量上限。

語法

pivot value:VAR(function_col_ref) [group:group_col_ref] [limit:limit_count]

引數是否必要?資料類型說明
function_col_ref字串待套用函式的資料欄名稱

如要進一步瞭解 grouplimit 參數,請參閱 Pivot 轉換

若要進一步瞭解語法標準,請參閱語言文件語法附註

function_col_ref

要依據其值計算變異數的資料欄名稱。資料欄必須含有整數或小數值。

  • 輸入內容不得為常值。
  • 不支援多個資料欄和萬用字元。

使用須知:

是否必要?資料類型示例值
字串 (資料欄參照)myValues

範例

此範例說明如何將統計函式套用於資料集。計算項目包括平均值 (均值)、最大值、最小值、標準差及變異數。

來源:

學生參加測驗的分數記錄如下。您想對這些資料進行統計分析:

StudentScore
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe85
Hannah99
Ian73
Jane68

轉換:

您可以使用下列轉換指令計算分數的平均值 (平均數)、最小值及最大值:

derive type:single value:AVERAGE(Score) as:'avgScore'

derive type:single value:MIN(Score) as:'minScore'

derive type:single value:MAX(Score) as:'maxScore'

若要將統計函式套用於資料,您可以使用 VARSTDEV 函式。這兩個函式可以作為其他統計計算的基礎。

derive type:single value:VAR(Score)

derive type:single value:STDEV(Score)

您現在可以使用下列指令,計算每一筆分數與平均分數之間的變異數:

derive type:single value:((Score - avg_Score) / stdev_Score) as:'stDevs'

您現在想依據公式套用成績:

成績相對於平均值的標準差 (stDevs)
AstDevs > 1
BstDevs > 0.5
C-1 <= stDevs <= 0.5
DstDevs < -1
FstDevs < -2

您可以使用 IF 函式建立下列轉換指令,藉此計算成績。

derive type:single value:IF((stDevs > 1),'A',IF((stDevs < -2),'F',IF((stDevs < -1),'D',IF((stDevs > 0.5),'B','C'))))

詳情請參閱 IF 函式

若要清理內容,您可以將某些格式設定套用於分數資料欄。以下指令會重設 stdev_ScorestDevs 資料欄的格式,顯示小數點後兩位:

set col:stdev_Score value:NUMFORMAT(stdev_Score, '##.00')

set col:stDevs value:NUMFORMAT(stDevs, '##.00')

derive type:single value:MODE(Score) as:'modeScore'

結果:

StudentScoremodeScoreavgScoreminScoremaxScorevar_Scorestdev_ScorestDevsGrade
Anna8485826899

87.00000000000001

9.330.21C
Ben718582689987.000000000000019.33-1.18D
Caleb768582689987.000000000000019.33-0.64C
Danielle878582689987.000000000000019.330.54B
Evan858582689987.000000000000019.330.32C
Faith928582689987.000000000000019.331.07A
Gabe858582689987.000000000000019.330.32C
Hannah998582689987.000000000000019.331.82A
Ian738582689987.000000000000019.33-0.96C
Jane688582689987.000000000000019.33-1.50D

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁