21-1 把正態分布設定為先驗分布,並進行推理
作為本書的最後一項推理,我們來共同研究使用正態分布的貝葉斯推理。
把正態分布設定為先驗分布的情形,一般認為有以下內容:
?使用的概率模型,通過正態分布所賦予。
?設定的類別出現在特定類別附近的可能性很高,而基本不會出現於遠離它的類別。
前者的原因在於,這是基於想要把先驗分布和模型的概率分布作為同一類別的構想下形成的,這樣的先驗分布稱為“共軛先驗分布”。把前者的說法用專業用語來表達,即“正態分布是共軛先驗分布”。
後者的原因在於,意味著作為“事前的先入之見”的“可能的類別”集中在某一處。例如,在“日本人的成年女性的身高”作為類別而設定的概率模型中,如果把100cm到200cm的可能性設定為對等,似乎不大合適。由於日本人的成年女性的身高大概在160cm左右,因此有“在160cm附近的可能性很大,而180cm或140cm等的可能性很低”這種先入為主的想法是很自然的。因此,設定身高的類別的先驗分布,在160cm附近是相對比較集中的,而遠離這一身高的,則相對分散。此時,可以說在正態分布的條件下進行設定是比較合適的。
21-2 用不準確的溫度計推算洗澡水的溫度
在貝葉斯推理中,通過各個類別的事前概率和各個類別中獲得信息隻有,必須要計算“~&~”這種形式的偶發事件的概率,這在之前已經操作過多次。用之前的例子進行說明,如第2講中,從類別“癌症”“健康”和獲得的信息“陽性”“陰性”中,計算“癌症&陽性”、“健康&陰性”等事件的概率;第3講中,從類別“真命天子”“無關路人”和獲得的信息“送出巧克力”“不送巧克力”中,計算“真命天子&不送”“無關路人&送出”等事件的概率。