是不是所有博弈均存在一個純策略(純策略是指參與者在其策略空間中選取的唯一確定的策略)的納什均衡點呢?答案是否定的。除了上麵敘說多次的、大家比較熟悉的純策略均衡點外,有的博弈並沒有一個確定的唯一的策略,而是存在一個混合策略(混合策略是指參與者采取的不是確定的唯一的策略,而是在其策略空間中以概率來選擇不同策略)均衡點。下麵我們將以警察與小偷的博弈為例對混合策略均衡點進行說明。
某小鎮隻有一名巡邏警察,他一個人要負責整個鎮的治安。假定該小鎮主要分為A、B兩區,A區有一家建設銀行,B區有一家金銀首飾店。再假定這個小鎮有一個小偷,要對該鎮實施偷盜行為。因為沒有分身術,警察一次隻能在一個區巡邏;而對於小偷來說,一次也隻能去一個地方行竊。
假定A區建設銀行需要保護的財產為2萬元,B區首飾店的財產價值1萬元。若警察在A區巡邏,而小偷也恰巧選擇去了該地,小偷就會被警察當場抓住,該區建設銀行的2萬元財產就不會損失;若警察在A區巡邏,而小偷卻選擇去了B區,因沒有警察的保護,小偷偷盜成功,B區首飾店的1萬元財產將分文不剩,全落進小偷的腰包。
在這種情況下,警察要怎麽巡邏才能使效果最好呢?
如果按照先前的思路——隻能選取一個確定的唯一的策略,那很明顯的做法是:警察在A區巡邏,可以保護該區建設銀行的2萬元財產不被偷竊。而小偷去B區,偷竊一定成功,B區首飾店的1萬元財產盡歸小偷所有。也就是說警察的收益是2萬元,而小偷的收益是1萬元。
但是這種做法是警察的最佳策略嗎?存不存在一種更好的策略或者說能不能對這種策略進行改進呢?
若警察在A區或B區巡邏,而小偷也正好選擇去A區或B區,則小偷無法實施偷盜,此時警察的收益為3(保住A區建設銀行和B區首飾店共3萬元財產),小偷的收益為0(沒有收益),記作(3,0)。