囚徒困境

囚徒困境是博弈論和非零和博弈中最經典的一個例子，它表示在某種情況下，那些有利於個人利益的選擇，相對於團體而言並非有益處。簡單來說，囚徒困境就是兩個被捕的囚徒之間所進行的一場特殊博弈。當這兩個囚徒想要建立合作、互相幫助時，便能夠讓雙方獲得利益，同時想要保持這種合作也是十分困難的。這種困難看似隻是一種模型，實際上在我們的生活中也有很多鮮活的例子，諸如價格的競爭、環境保護，甚至是我們所麵臨的社交問題，都存在著不同程度的“囚徒困境”。

20世紀50年代，囚徒困境首次被美國的梅裏爾·弗勒德和梅爾文·德雷希爾提出，並擬定了相關困境的理論。隨後，美國蘭德公司的顧問艾伯特·塔克正式用“囚徒”的形式將其表述出來，而且正式命名為“囚徒困境”。

簡言之，當兩個共謀犯同時被抓捕入獄，而且不能互相交流時，若是這兩個人互不揭發對方，便會由於無法找到確切的證據，並且根據實際情況對兩人判處同樣的罪行，假設會判刑1年。但是，若其中的一方選擇揭發對方的罪行，但是另外一方選擇沉默，法官可能會將揭發者從輕處置，或者出於揭發者提供的證據，將揭發者利益釋放，而沉默的一方則會由於不配合警方的調查、揭發者提供的確鑿信息隨即立案，被判處10年。還有一種情況便是共謀犯互相揭發、指證，那麽便會提供完整的證據，最後雙方都判刑8年。最終的結果往往更加偏向於最後一種，即由於無法交流、互不信任，最後互相揭發。這種情況，恰好印證了約翰·納什的非合作博弈理論。

事實上，囚徒困境僅發生一次和多次的結果是不同的。假設囚徒困境是重複進行的，那麽博弈便會在其中不斷重複進行，這時所有的參與者都可以做出決策去“懲罰”前麵那些不願意參與到合作中的人，在這種情況下，便會產生所有的參與者想要合作的局麵。那些參與此次重複博弈的人，便會主動放棄自身欺騙的動機或者行為，導致所有的參與者的決策都向合作靠攏，最終經過反複博弈後，所有的參與者極有可能從最初的互相猜忌轉變為相互信任。

[展開閱讀全文]