數據的分布存在不均衡的情況,能夠反映這種不均衡程度的指標就是標準差。另外,對某個值的評價,會隨著不均衡程度的不同而變化。那麽,標準差是怎麽計算的呢?應該如何去應用呢?
用於描述不均衡的指標是標準差。這是用來反映數據整體的分布如何分散或者如何集中的值。首先說明一下它是怎麽計算的。
假設我們對某項知識進行問答測試後,得出圖1和圖2的結果。
圖1的平均分是60分,最低分是40分,最高分是80分。
圖2的平均分是60分,最低分是20分,最高分是100分。
圖1的數據整體分布,在60分的位置出現峰值,數據都分布在靠近60分的地方。雖然圖2的平均分也是60分,數據的峰值也在60分附近,但從數據均衡性的角度來看,與圖1相比,其山腳位置分布更加廣泛。用數值來表現這種分布的差異,就是標準差。
圖1的標準差計算如下。
離散程度(與平均數之差的平方的和)
=(-20)×(-20)×1
+(-10)×(-10)×4
+(0)×(0)×6
+(10)×(10)×4
+(20)×(20)×1
= 1600
方差(除以數據個數)
= 1600÷(1+4+6+4+1)
= 100
標準差(計算平方根)
= 10
同樣地,圖2的標準差計算如下。
離散程度(與平均數之差的平方的和)
=(-40)×(-40)×1
+(-30)×(-30)×1
+(-20)×(-20)×1
+(-10)×(-10)×3
+(0)×(0)×4
+(10)×(10)×3
+(20)×(20)×1
+(30)×(30)×1
+(40)×(40)×1
= 6400
方差(除以數據個數)
= 6400÷(1+1+1+3+4+3+1+1+1)
= 400
標準差(計算方根)
= 20
綜上所述:
圖1的平均分是60分,最低分是40分,最高分是80分,標準差是10。