16-1 到達到實用水平,需要“概率分布圖”和“期待值”
截至上一講,我們已經完成了對於貝葉斯推理的基本技巧、以及運用常見的概率記號對其進行描述的知識點進行了解說。至此,進行簡單設定的推理已經完全不成問題。但如果要對於稍微複雜的設定進行推理、或是進行通用性推理的話,之前所介紹的方法就略顯不足了。
對於稍微複雜的設定進行推理、以及進行通用性推理時,需要了解“概率分布圖”和“期待值”相關的知識,尤其是在連續性概率分布這種基本事件無限多的情況下,以上背景知識更是不可缺少的。我們從本講開始學習這個知識點。而在後麵幾講中,將會對貝葉斯推理中最有代表性、重要的“貝塔分布”和“正態分布”進行解說。在本講中,首先為大家解說貝塔分布的出發點——“均勻分布”的相關內容。
16-2 思考“同樣的可能”型的概率模型
想象一下拋硬幣和擲骰子試驗的常規概率模型,就很容易理解“均勻分布”的概念了。
正如第14講中解說的那樣,概率模型是根據基本事件和對其概率的分配來進行定義的。以拋硬幣為例,其基本事件的集合表示為:
{正麵,反麵}
為每個基本事件分配相同的概率,即:
這些基本事件被稱為“大致相同”。也就是說,可以把“正麵”和“反麵”設定為基本相同的情況。
而在擲骰子的情況,也正如第14講中所解說的那樣,基本事件的集合可以表示為:
{1,2,3,4,5,6}
而分配概率的方法,則是把點數K出現的概率記為p({k}),那麽:
此時,6個基本事件也是“大致相同”的。
用麵積圖來描述拋硬幣和擲骰子的概率模型,如圖表16-1所示,由於可能性“大致相同”,所以長方形被分為麵積相等的幾份。