範例 - 統計函式

此範例說明如何將統計函式套用於資料集。計算項目包括平均值 (均值)、最大值、最小值、標準差及變異數。

來源:

學生參加測驗的分數記錄如下。您想對這些資料進行統計分析:

StudentScore
Anna84
Ben71
Caleb76
Danielle87
Evan85
Faith92
Gabe85
Hannah99
Ian73
Jane68

轉換:

您可以使用下列轉換指令計算分數的平均值 (平均數)、最小值及最大值:

derive type:single value:AVERAGE(Score) as:'avgScore'

derive type:single value:MIN(Score) as:'minScore'

derive type:single value:MAX(Score) as:'maxScore'

若要將統計函式套用於資料,您可以使用 VARSTDEV 函式。這兩個函式可以作為其他統計計算的基礎。

derive type:single value:VAR(Score)

derive type:single value:STDEV(Score)

您現在可以使用下列指令,計算每一筆分數與平均分數之間的變異數:

derive type:single value:((Score - avg_Score) / stdev_Score) as:'stDevs'

您現在想依據公式套用成績:

成績相對於平均值的標準差 (stDevs)
AstDevs > 1
BstDevs > 0.5
C-1 <= stDevs <= 0.5
DstDevs < -1
FstDevs < -2

您可以使用 IF 函式建立下列轉換指令,藉此計算成績。

derive type:single value:IF((stDevs > 1),'A',IF((stDevs < -2),'F',IF((stDevs < -1),'D',IF((stDevs > 0.5),'B','C'))))

詳情請參閱 IF 函式

若要清理內容,您可以將某些格式設定套用於分數資料欄。以下指令會重設 stdev_ScorestDevs 資料欄的格式,顯示小數點後兩位:

set col:stdev_Score value:NUMFORMAT(stdev_Score, '##.00')

set col:stDevs value:NUMFORMAT(stDevs, '##.00')

derive type:single value:MODE(Score) as:'modeScore'

結果:

StudentScoremodeScoreavgScoreminScoremaxScorevar_Scorestdev_ScorestDevsGrade
Anna8485826899

87.00000000000001

9.330.21C
Ben718582689987.000000000000019.33-1.18D
Caleb768582689987.000000000000019.33-0.64C
Danielle878582689987.000000000000019.330.54B
Evan858582689987.000000000000019.330.32C
Faith928582689987.000000000000019.331.07A
Gabe858582689987.000000000000019.330.32C
Hannah998582689987.000000000000019.331.82A
Ian738582689987.000000000000019.33-0.96C
Jane688582689987.000000000000019.33-1.50D
本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
Google Cloud Dataprep 說明文件
需要協助嗎?請前往我們的支援網頁