首頁 統計學關我什麽事:生活中的極簡統計學

第20講 在拋硬幣或天體觀測時觀察到的“正態分布”

20-1 統計學的主角——“正態分布”

在統計學中,最常用的是被稱為“正態分布”的連續型概率分布。在標準統計學(內曼-皮爾遜統計學)中如此,在貝葉斯統計學中亦是如此。

正態分布之所以應用如此廣泛的原因,主要有兩個:

第一,正態分布有著十分便利的數學操作性,這一點在後麵將會涉及。第二,正態分布是一種在自然界和社會中頻繁出現的概率分布。本節將對第二點進行簡要說明。

最初發現正態分布的實驗是這樣的:投擲N枚硬幣時,把出現正麵的x枚硬幣的概率記為p(x),當N足夠大的時候,p(x)的分布圖會呈現出特殊的形狀(吊鍾型)。亞伯拉罕-棣莫弗和拉普拉斯等數學家發現了該圖表中對應的函數,即圖表20-1的公式。

此後,數學家高斯在擔任天文台主任時,通過分析天體觀測時的誤差所呈現出來的概率分布,也推導出了同樣的分布圖。

圖表20-1 標準正態分布

在高斯的研究之後,隨著概率理論和統計學的進步,人們發現,在很多場合都能夠觀察到這樣的正態分布。例如,通過觀察包括人類在內的各種各樣的生物種群,可以發現了同一種群的體長遵循正態分布的規律。此外,在體內的構成物(血液等)的分布,也呈正態分布趨勢;在收到電波時出現的噪音中,也觀察到了正態分布的現象。而最近的股票收益率也呈正態分布,這是個強有力的證明。總之,正態分布出現在我們身邊的很多現象中。

20-2 呈現吊鍾型的正態分布

正態分布是指,分布圖呈現特殊形狀的一類分布。為了讓大家了解具體的形狀,首先,我們來看被稱為“標準正態分布”代表性圖表——圖表20-1。橫軸x表示類別的數值,縱軸y表示的是出現的概率密度,該圖表具有如下特征: