首頁 統計學關我什麽事:生活中的極簡統計學

第18講 決定概率分布性質的“期待值”

18-1 用一個數值來代表概率分布

在貝葉斯推理中,可以計算出各個類別的後驗概率。例如,第2講中,可以根據檢查結果呈陽性,計算出“患癌症的後驗概率為4.5%”“身體健康的後驗概率為95.5%”。如果將患癌症設為數值1、身體健康設為數值0的話,這與在x=0,1時計算出的概率分布情況相同,因此也可以視為一個問題得到了解決。

但是,第4講的案例:根據某對夫婦第一胎為女孩的事實,來計算“第二胎也是女孩的後驗概率”,這種情況又需要另當別論。第4講中,將該夫婦生女孩的概率設為“0.4”、“0.5”、“0.6”三種,並計算這三種情況各自的可能性。通過貝葉斯推理得出的結論是:“0.4”的後驗概率為27%,“0.5”的後驗概率為33%,“0.6”的後驗概率為40%。也就是說,設定x=0.4、0.5、0.6時,計算得出的概率分布分別為0.27、0.33、0.4。但是,上述結論並不能解答“該夫婦第二胎也是女孩的概率”的問題,而是提供一個用數值來回答問題的方法,這個數值就是所謂的“期待值”。第4講中雖然講解了期待值的計算方法,但並沒有詳細說明期待值的含義。現在,我們已經掌握了概率分布的思考方式,所以可以詳細地了解一下“期待值”的相關知識。

18-2 期待值的計算方法

下麵,通過具體事例來講解,用一個數值來代表概率分布“期待值”的計算方法。首先,第14講中關於天氣的概率模型為例,其基本事件的集合為:

{晴天,陰天,雨天,雪天}

將其概率分布設定為:

p({晴天})=0.3、p({陰天})=0.4、p({雨天})=0.2、p({雪天})=0.1

為了製作概率分布圖,在這裏需要將基本事件設為數值。設定天氣越惡劣,數值越大,即:

晴天→1、陰天→2、雨天→3、雪天→4