首頁 統計學關我什麽事:生活中的極簡統計學

第2講 貝葉斯推理的結果,有時與直覺大相徑庭① 使用客觀數據時的注意事項

2-1 計算罹患癌症的概率

本講是通過一些容易獲取客觀數據的案例,對於貝葉斯推理進行說明。需要了解的重點是,理解“如果從客觀的數據來考慮的話,反而會容易陷入誤解之中”的問題。在這裏,你會發現概率的不可思議。

下麵,用醫療診查來舉例進行說明。

在醫療發達的當今社會,我們能夠獲得多數病症的統計數據。另外,在發覺自己出現了一定症狀之前,就能夠發現病情的技術也在不斷發展進步。但是,依然存在一個問題:如何判斷通過檢查得出的“是/不是X病情”這一結果的準確性呢?

假設,你接受了一項“如果患了特定的癌症的話,結果有95%的概率為陽性的檢查”,並且在之後收到了結果為陽性的報告。此時,你會判斷自己患該癌症的概率為95%嗎?

答案是“不會”。

如果“自己患癌症的概率真的為95%”的話,你肯定會對這個結果感到非常悲觀。實際上,對此做出錯誤判斷的人大概有很多吧。但是,從“陽性”這個結果來推斷“你患了癌症的概率”,這也並不是一個特別高的數字。

在該推算中,由於是從“陽性”這一“結果”追溯到“患癌症”這一“原因”,因此可看作貝葉斯推理的典型案例。

在本講中,我們首先進行問題的設定。以下數據是為了簡化計算而假設的虛構數值,並非真實的數據。

問題設定

假設,某種特定的癌症的患病率為0.1%(0.001)。有一個簡易的方法能夠檢查出是否患上這種癌症:患上這種癌症的人中有95%(0.95)的概率被診斷為陽性。但另一方麵,健康人群也有2%(0.02)的可能性被誤診為陽性。那麽,如果在這個檢查中被診斷為陽性的時候,實際患上這種癌症的概率為多少呢?

2-2 根據醫療數據,設定“先驗概率”