在某個小鎮上隻有一名警察,整個小鎮的治安全部由他負責。此時,我們假設這個小鎮上的一頭有一家銀行,而小鎮的另一頭有一個酒館;若這個小鎮上隻有一名小偷,那麽由於他不具備分身術,所以當這個小鎮上的警察在小鎮的一頭巡視時,小偷隻能去小鎮的另一頭采取他的偷盜行動。
假想一下,當小鎮的警察正好在小偷采取行動的地方巡視,便能不費吹灰之力地抓住小偷;若是小鎮的警察的巡視方向恰好與小偷采取偷盜行為的方向相反,那麽小偷便能在不被警察抓到的情況下成功偷盜。
此時,我們設定此小鎮上的銀行中需要保護財產的金額為2萬元,而小鎮的酒館中需要保護的金額隻有1萬元。那麽,警察應該如何采取巡視行動,才能將小鎮的損失降低到最小呢?
警察最好的做法是利用抽簽的方式決定去小鎮的銀行還是酒店。由於小鎮銀行中所需保護的財產是酒館的兩倍,因此用1、2號兩個簽表示小鎮的銀行,用3號簽表示酒館,這樣一來,警察去銀行巡視的機會將達到2/3,而去酒館巡視的機會將是1/3。
在小鎮警察的此種策略下,小偷的占優策略則要與警察相反,同樣采用抽簽的方式,與警察不同的是小偷用1、2號簽表示去酒館行動,而用3號簽表示去銀行,由此一來,小偷去酒館行動的概率是2/3,而去銀行的概率僅有1/3。
在此前提下,即警察和小偷都是選擇最佳占優策略時,我們將會獲得一個十分有趣的結果,即警察和小偷成功的概率是相等的。(此處略去計算過程)
事實上,警察與小偷的博弈需要有雙方一種混合型的策略和思路。簡單來說,警察和小偷博弈與我們生活中經常玩的“剪刀、石頭、布”遊戲更加相似。在這種遊戲中,並不存在納什均衡,因為參與此遊戲的每個人出“剪刀”“石頭”“布”的情況都是隨機的,而且遊戲的參與者不會讓對方推斷出自己的策略,甚至自己在此遊戲中的策略傾向性。因為,當對方了解到自己的策略傾向時,自己便會麵臨極大的輸掉遊戲的風險。