房地產(chǎn)開發(fā)博弈、警察捉小偷與混和策略
實際上,在每個參與人都有優(yōu)勢策略的情況下,優(yōu)勢策略均衡是非常合乎邏輯的。一個優(yōu)勢策略優(yōu)于其他任何策略,同樣,一個劣勢策略則劣于其他任何策略。
假如你有一個優(yōu)勢策略,你可以選擇采用,并且知道你的對手若是有一個優(yōu)勢策略他也會照辦;同樣,假如你有一個劣勢策略,你應該避免采用,并且知道你的對手若是有一個劣勢策略他也會規(guī)避。
但遺憾的是,并不是所有博弈都有優(yōu)勢策略,哪怕這個博弈只有兩個參與者。實際上,優(yōu)勢策略只是博弈論的一種特例。雖然出現(xiàn)一個優(yōu)勢策略可以大大簡化行動的規(guī)則,但這些規(guī)則卻并不適用于大多數(shù)現(xiàn)實生活中的博弈。
來看這樣一個房地產(chǎn)開發(fā)博弈的例子。假定北京市的房地產(chǎn)市場需求有限,A、B兩個開發(fā)商都想開發(fā)一定規(guī)模的房地產(chǎn),但是市場對房地產(chǎn)的需求只能滿足一個房地產(chǎn)的開發(fā)量,而且,每個房地產(chǎn)商必須一次性開發(fā)這一定規(guī)模的房地產(chǎn)才能獲利。在這種情況下,無論是對開發(fā)商A還是開發(fā)商B,都不存在一種策略完全優(yōu)于另一種策略,也不存在一個策略完全劣于另一個策略。
因為,如果A選擇開發(fā),則B的最優(yōu)策略是不開發(fā);如果A選擇不開發(fā),則B的最優(yōu)策略是開發(fā);類似地,如果B選擇開發(fā),則A的最優(yōu)策略是不開發(fā);如果B選擇不開發(fā),則A的最優(yōu)策略是開發(fā)。這樣就形成了一個循環(huán)選擇。
根據(jù)納什均衡含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。即雙方在對方給定的策略下不愿意調(diào)整自己的策略。
這個博弈的納什均衡點不止一個,而是兩個:要么A選擇開發(fā),B不開發(fā);要么A選擇不開發(fā),B選擇開發(fā)。在這種情況下,A與B都不存在優(yōu)勢策略,也就是A和B不可能只要選擇某一個策略而不考慮對方的所選擇的策略。實際上,在有兩個或兩個以上納什均衡點的博弈中,其最后結果難以預測。在房地產(chǎn)博弈中,我們無法知道,最后結果是A開發(fā)B不開發(fā),還是A不開發(fā)B開發(fā)。
再來看這樣一個警察捉小偷博弈的例子。某個村莊上只有一名警察,他要負責整個村的治安。小村的兩頭住著兩個全村最富有的村民A和B,A、B分別需要保護的財產(chǎn)為2萬元、1萬元。整個小村某一天來了個小偷,要在村中偷盜A和B的財產(chǎn),這個消息被警察得知。
因為分身乏術,警察一次只能在一個地方巡邏;而小偷也只能偷盜其中一家。若警察在某家看守財產(chǎn),而小偷也選擇了去該富戶家,就會被警察抓??;若警察沒有看守財產(chǎn)的富戶家而小偷去了,則小偷偷盜成功。
一般人會憑著感覺認為,警察當然應該看守富戶A家財產(chǎn),因為A有2萬元的財產(chǎn),而B只有1萬元的財產(chǎn)。實際上,對于警察的一個最好的做法是,警察抽簽決定去A家還是B家。
因為A家的財產(chǎn)是B家的2倍,小偷自然光顧A家的概率要高于B家,不妨用兩個簽代表A家,比如如果抽到1、2號簽去A家,抽到3號簽去B家。這樣警察有2/3的機會去A家做看守,1/3的機會去B家做看守。
而小偷的最優(yōu)選擇是:以同樣抽簽的辦法決定去A家還是去B家實施偷盜,只是抽到1、2號簽去A家,抽到3號簽去B家,那么,小偷有l(wèi)/3的機會去A家,2/3的機會去B家。這些數(shù)值是可以通過聯(lián)立方程準確計算出的,筆者這里就不給出具體的數(shù)學計算過程了。
細心的讀者會發(fā)現(xiàn),警察捉小偷博弈與前面所舉的兩個博弈案例有一個很大的差別,就是用到了概率的知識,警察與小偷沒有一個一定要選擇某個策略的納什均衡,而只有選擇某個策略是多少幾率的納什均衡。
在博弈論中,可以選擇出某個策略的納什均衡,這個策略叫做純策略。
用專業(yè)的話來說,所謂純策略是指參與者在他的策略空間中選取惟一確定的策略。但至少存在一個混合策略均衡點。
所謂混合策略是指參與者采取的不是惟一的策略,而是其策略空間上的概率分布。這就是納什于1950年證明了的納什定理。而這個博弈沒有純策略納什均衡點,而有混合策略均衡點。這個混合策略均衡點下的策略選擇是每個參與者的混合策略選擇。
最常見混和策略就是猜硬幣游戲。比如在足球比賽開場,裁判將手中的硬幣拋擲到空中,讓雙方隊長猜硬幣落下的正反面。由于硬幣落下是正是反是隨機的,概率應該都是1/2。那么,猜硬幣游戲的參與者都是1/2的概率選擇正與反,這時博弈達到混和策略納什均衡。
再比如我們兒時玩的“剪、布、錘”就不存在純策略均衡,對每個小孩來說,自己采取出“剪”、“布”、還是“錘”的策略應當是隨機的。一旦一方知道另一方出其中某個策略的可能性增大,那么這個對弈者在游戲中輸?shù)目赡苄跃驮龃?。因此,每個小孩的最優(yōu)混合策略是采取每個策略的可能性是l/3。在這樣的博弈中,每個小孩各取三個策略的1/3是納什均衡。
由此可見,純策略是參與者一次性選取的,并且堅持他選取的策略。而混合策略是參與者在各種備選策略中采取隨機方式選取的。
在博弈中,參與者可以改變他的策略,而使得他的策略選取滿足一定的概率。當博弈是零和博弈時,即一方所得是另外一方的所失時,此時只有混合策略均衡。對于任何一方來說,此時不可能有純策略的占優(yōu)策略。