2-1 計算罹患癌症的概率
本講是通過一些容易獲取客觀數據的案例,對於貝葉斯推理進行說明。需要了解的重點是,理解“如果從客觀的數據來考慮的話,反而會容易陷入誤解之中”的問題。在這裏,你會發現概率的不可思議。
下麵,用醫療診查來舉例進行說明。
在醫療發達的當今社會,我們能夠獲得多數病症的統計數據。另外,在發覺自己出現了一定症狀之前,就能夠發現病情的技術也在不斷發展進步。但是,依然存在一個問題:如何判斷通過檢查得出的“是/不是X病情”這一結果的準確性呢?
假設,你接受了一項“如果患了特定的癌症的話,結果有95%的概率為陽性的檢查”,並且在之後收到了結果為陽性的報告。此時,你會判斷自己患該癌症的概率為95%嗎?
答案是“不會”。
如果“自己患癌症的概率真的為95%”的話,你肯定會對這個結果感到非常悲觀。實際上,對此做出錯誤判斷的人大概有很多吧。但是,從“陽性”這個結果來推斷“你患了癌症的概率”,這也並不是一個特別高的數字。
在該推算中,由於是從“陽性”這一“結果”追溯到“患癌症”這一“原因”,因此可看作貝葉斯推理的典型案例。
在本講中,我們首先進行問題的設定。以下數據是為了簡化計算而假設的虛構數值,並非真實的數據。
問題設定
假設,某種特定的癌症的患病率為0.1%(0.001)。有一個簡易的方法能夠檢查出是否患上這種癌症:患上這種癌症的人中有95%(0.95)的概率被診斷為陽性。但另一方麵,健康人群也有2%(0.02)的可能性被誤診為陽性。那麽,如果在這個檢查中被診斷為陽性的時候,實際患上這種癌症的概率為多少呢?
2-2 根據醫療數據,設定“先驗概率”