首頁 工作一年拉開差距:邏輯思考

第12講 把握不均衡

數據的分布存在不均衡的情況,能夠反映這種不均衡程度的指標就是標準差。另外,對某個值的評價,會隨著不均衡程度的不同而變化。那麽,標準差是怎麽計算的呢?應該如何去應用呢?

用於描述不均衡的指標是標準差。這是用來反映數據整體的分布如何分散或者如何集中的值。首先說明一下它是怎麽計算的。

假設我們對某項知識進行問答測試後,得出圖1和圖2的結果。

圖1的平均分是60分,最低分是40分,最高分是80分。

圖2的平均分是60分,最低分是20分,最高分是100分。

圖1的數據整體分布,在60分的位置出現峰值,數據都分布在靠近60分的地方。雖然圖2的平均分也是60分,數據的峰值也在60分附近,但從數據均衡性的角度來看,與圖1相比,其山腳位置分布更加廣泛。用數值來表現這種分布的差異,就是標準差。

圖1的標準差計算如下。

離散程度(與平均數之差的平方的和)

=(-20)×(-20)×1

+(-10)×(-10)×4

+(0)×(0)×6

+(10)×(10)×4

+(20)×(20)×1

= 1600

方差(除以數據個數)

= 1600÷(1+4+6+4+1)

= 100

標準差(計算平方根)

= 10

同樣地,圖2的標準差計算如下。

離散程度(與平均數之差的平方的和)

=(-40)×(-40)×1

+(-30)×(-30)×1

+(-20)×(-20)×1

+(-10)×(-10)×3

+(0)×(0)×4

+(10)×(10)×3

+(20)×(20)×1

+(30)×(30)×1

+(40)×(40)×1

= 6400

方差(除以數據個數)

= 6400÷(1+1+1+3+4+3+1+1+1)

= 400

標準差(計算方根)

= 20

綜上所述:

圖1的平均分是60分,最低分是40分,最高分是80分,標準差是10。