最大最小策略是指局中人使得能夠獲得的最小收益最大化的策略。 實驗者自己可以為競爭者指定決定策略,為競爭者制定了4種不同的策略,即最大化、折扣(非線性策略,短期利益不成比例的被估價)、最大最小捕獲量(最大化最小收獲,始終是一個可以支撐的策略)以及針鋒相對策略(做其他參與者先前所做的)。 需要強調(diào)說明的是,優(yōu)勢策略均衡與納什均衡的概念是建立在博弈者理性行為的基礎(chǔ)上的。每一個博弈者的策略選擇不僅依賴于自己的理性行為,也依賴于對手的理性行為。即,不僅每個博弈者自己是理性的,而且每個博弈者知道對手是理性的,每個博弈者知道對手知道自己是理性的,每個博弈者知道對手知道自己知道對手是理性的,……等等。
正是因為要達到優(yōu)勢策略均衡或納什均衡是需要絕對理性的。任何出現(xiàn)了一點錯誤將可能使博弈者蒙受巨大的損失,因而可能有player會采取比較保守的策略。
其中一種保守的策略是最大最小策略(Maximin strategy)。
最大最小策略是什么呢?它是指博弈者所采取的策略是使自己能夠獲得的最小收入最大化。所謂最小收入是指采取某種策略所能獲得的最小收入。
最大最小策略是一種保守的策略而不是利潤最大化的策略。
很顯然,博弈者往往是在信息不完全的情況下才采取最大最小策略。在信息完全的情形下,他肯定是會采取促使他利潤最大化的策略。
在某些情況下,最大最小策略所達到的均衡也是一種納什均衡。[1]
納什均衡是建立在參與者理性行為基礎(chǔ)上的,這就使參與者的決策時面臨可能出現(xiàn)某些非理性行為的風(fēng)險。為了降低風(fēng)險,決策者可以采取最大最小策略以便降低風(fēng)險,即在各種策略的最小收益中,選擇具有最大收益的策略。其代價是放棄最優(yōu)策略。
下圖是一個產(chǎn)品開發(fā)博弈的收益矩陣。其中,按照理性行為會有兩種納什均衡,(無新產(chǎn)品,有新產(chǎn)品)以及(有新產(chǎn)品,無新產(chǎn)品)。但如果采取最大最小策略,兩個企業(yè)都不推出新產(chǎn)品。
最大最小決策規(guī)則的一個重要思想來源是20世紀著名數(shù)學(xué)家馮諾伊曼關(guān)于二人零和博弈的定理,其中每個人都選擇能夠最大化自己的最小的可能支付(相應(yīng)于對手的各個策略)的策略。
在實際生活中,往往還會遇到非常糟糕的情況,如何選擇,做到最大化可能遭遇到的最小的利益,也是傷透腦筋的事情。有時個體的理智不一定會帶來理想的結(jié)局,甚至可能是最壞的結(jié)果。
例如,其中的囚徒困境(Prisoners Dilemma)值得我們深思。用表1來解釋。從表中可知,對兩囚徒而言最好的結(jié)果應(yīng)該是都不坦白,入獄年數(shù)是最短的,可這里雙方都存在一個非常穩(wěn)定的占優(yōu)策略――坦白,因為坦白可以避免自己陷入最糟糕境地,不論對方采取何態(tài)度自己坦白都是最好的,但結(jié)果卻對于雙方來說都及其糟糕。其實,這就是一種最大最小策略。這種情況下,個人理性與團隊理性顯然存在激烈的沖突。
表1:囚徒困境 囚徒乙
坦白 不坦白
囚徒甲 坦白 -6,-6 0,-10
不坦白 -10,0 -1,-1
表2:寡頭合作的不穩(wěn)定性 廠商乙
合作 不合作
廠商甲 合作 200,200 120,240
不合作 240,120 160,160
囚徒困境同樣適于分析寡頭壟斷廠商合作的不穩(wěn)定性。見表2。分析表中數(shù)據(jù),整體而言最理性的做法是(合作,合作)。于是,諸如OPEC等組織會聯(lián)手以期達到利潤最大化。但同時,另外有種激勵,若自己悄悄毀約、不遵守協(xié)議自己的獲利會高于合作下的獲利。于是(不合作,不合作)的策略組合排擠掉了(合作,合作)的策略組合,并且由于(不合作,不合作)組合還是一個占優(yōu)策略均衡,所以,卡特爾經(jīng)常以失敗告終也就屬情理之中了。
在有些情況下,為了避免陷入被動,采取最大最小策略十分必要。在下圖的博弈中,乙方采取“右”是一個支配性策略。因為不管甲方選什么,乙方采取右的策略都比左的策略好,可以得到1的收益。在期望乙方采取右的情況下,甲方應(yīng)該采取“下”,并得到2的收益。這樣,支配性策略均衡為(下,右)。如果甲方比較慎重,考慮到乙方可能不一定理性,或者可能故意捉弄甲方,則應(yīng)該采取最大最小策略,
|