囚徒困境是博弈論和非零和博弈中最經典的一個例子,它表示在某種情況下,那些有利於個人利益的選擇,相對於團體而言並非有益處。簡單來說,囚徒困境就是兩個被捕的囚徒之間所進行的一場特殊博弈。當這兩個囚徒想要建立合作、互相幫助時,便能夠讓雙方獲得利益,同時想要保持這種合作也是十分困難的。這種困難看似隻是一種模型,實際上在我們的生活中也有很多鮮活的例子,諸如價格的競爭、環境保護,甚至是我們所麵臨的社交問題,都存在著不同程度的“囚徒困境”。
20世紀50年代,囚徒困境首次被美國的梅裏爾·弗勒德和梅爾文·德雷希爾提出,並擬定了相關困境的理論。隨後,美國蘭德公司的顧問艾伯特·塔克正式用“囚徒”的形式將其表述出來,而且正式命名為“囚徒困境”。
簡言之,當兩個共謀犯同時被抓捕入獄,而且不能互相交流時,若是這兩個人互不揭發對方,便會由於無法找到確切的證據,並且根據實際情況對兩人判處同樣的罪行,假設會判刑1年。但是,若其中的一方選擇揭發對方的罪行,但是另外一方選擇沉默,法官可能會將揭發者從輕處置,或者出於揭發者提供的證據,將揭發者利益釋放,而沉默的一方則會由於不配合警方的調查、揭發者提供的確鑿信息隨即立案,被判處10年。還有一種情況便是共謀犯互相揭發、指證,那麽便會提供完整的證據,最後雙方都判刑8年。最終的結果往往更加偏向於最後一種,即由於無法交流、互不信任,最後互相揭發。這種情況,恰好印證了約翰·納什的非合作博弈理論。
事實上,囚徒困境僅發生一次和多次的結果是不同的。假設囚徒困境是重複進行的,那麽博弈便會在其中不斷重複進行,這時所有的參與者都可以做出決策去“懲罰”前麵那些不願意參與到合作中的人,在這種情況下,便會產生所有的參與者想要合作的局麵。那些參與此次重複博弈的人,便會主動放棄自身欺騙的動機或者行為,導致所有的參與者的決策都向合作靠攏,最終經過反複博弈後,所有的參與者極有可能從最初的互相猜忌轉變為相互信任。