12-1 在進行貝葉斯推理時,即使忘記了之前的信息也是合乎邏輯的
上一講中,以垃圾郵件過濾器為例,對於從2條信息中計算出來後驗概率的進行了解釋說明。結論如圖表12-1所示。
圖表12-1 依據兩條信息進行貝葉斯推理
實際上,像這樣通過連續收集到的信息而進行的連續推理(稱為逐步推理),具有十分奇妙的性質。簡單地說,就是“通過獲得信息①而修改了各個類別的概率之後,再通過信息②來進行推理時,可以暫時忘記之前的信息①,這樣做是沒有問題的”。這在專業上被稱為“序貫理性”,也是貝葉斯推理的突出性質之一。本講將繼續以上一講中的垃圾郵件過濾器為例,來對這個性質進行說明。
圖表12-2 依據從信息①中得到的信息進行貝葉斯推理
12-2 把從信息①中得到的後驗概率,設為“先驗概率”
首先,我們來回顧上一節中最初的推理過程(從“附帶鏈接”這一信息中得到的後驗概率)。
事前設定“垃圾郵件”和“正常郵件”這2種類別,它們的先驗概率均為0.5(理由不充分原理)。然後,將每個類別再分為“附帶鏈接”和“無鏈接”兩種情況,並計算每種可能性的概率。
現在,掃描出來的結果是檢出了“附帶鏈接”(我們將其稱為信息①)。根據信息①計算後驗概率,圖表12-1中顯示,推測結果是垃圾郵件的後驗概率①為3/4,結果是普通郵件的後驗概率①為1/4。
換言之,根據信息①,先驗概率由各為0.5,變更(更新)為0.75和0.25這一後驗概率,如圖表12-2所示。
接下來,我們來試著做一個有趣的構想:把計算出的後驗概率再次設定為各個類別的先驗概率,如圖表12-3所示。
圖表12-3 把從信息①得出的後驗概率,設定為先驗概率