今天,跟大家分享博弈論里的一個重要理論——納什均衡。 先來看一個經(jīng)典案例:有兩名囚犯犯了重罪,分開關(guān)在牢房里。然而,檢方手頭的證據(jù)只夠證明他們犯了一起輕罪,最多能判處一年徒刑。于是檢方告訴兩人:如果有一人招供,另一人保持沉默,招供者可免于起訴,而沉默者將會在牢房里待上20年。如果兩人都招供,則同時服刑5年。要是兩人均保持沉默,則同時服刑1年。 很顯然,“雙方都保持沉默”是最優(yōu)策略,這樣兩人都只需服刑1年。然而,真實(shí)的情況是,這兩名囚犯是被分開關(guān)的,雙方不得串供。這樣一來,他們的選擇還是“沉默”嗎? 不如設(shè)想一下自己就是其中一名囚犯,你不知道對方會做出什么樣的選擇。如果對方招供,那你肯定也得招供,否則將要服刑20年;如果對方沉默,你也沉默的話,將服刑1年,但如果你招供的話,你可以被釋放。從利己的角度出發(fā),不管對方怎么做,招供對你來說都是最有利的。兩個人動同樣的腦筋,最后的結(jié)果就是兩個人都選擇了招供,都被判了5年的刑期。 這就是著名的“囚徒困境”。每個人都選對自己最有利的,但最終獲得一個對雙方都最差的結(jié)果,這反應(yīng)了個人理性和集體理性的矛盾。 為什么會出現(xiàn)這一結(jié)果?是什么原因使得雙方最后都選擇了“損人不利己”呢?這就要說到美國數(shù)學(xué)家約翰·納什,和他著名的“納什均衡”了。 亞當(dāng)·斯密認(rèn)為,在市場經(jīng)濟(jì)中,個體追求私利的行為,會促進(jìn)集體利益的最大化。但納什卻發(fā)現(xiàn):基于理性人的假設(shè),從利己目的出發(fā),結(jié)果卻是損人不利己,既不利己也不利他。 比如上面的例子,誰會在乎兩人的利益最大化,他們只在乎一件事:如果對方招供,而自己沉默,那自己就完了。這個風(fēng)險(xiǎn)承受不起,博弈到最后,就是雙方都招供。 而且,一旦“都招供”的結(jié)果形成,會非常穩(wěn)定。什么意思呢?你想改變現(xiàn)狀,決定沉默,則將服刑20年;如果對方單方面沉默,也會服刑20年。誰也無法單方改變現(xiàn)狀。因此,在這個“制度設(shè)計(jì)”下,“都招供”就成了一個穩(wěn)定的“納什均衡”,雖然它是一個“壞的均衡”。 因此,簡單來說,納什均衡就是一種博弈的穩(wěn)定結(jié)果,誰單方改變策略,誰就會損失。 那么,有沒有可能把“壞的均衡”變成“好的均衡”呢?即從“不合作”到“合作”?有,那就是改變“制度設(shè)計(jì)”。 舉個例子:假設(shè)有A、B兩個人,如果A和B合作,則每人賺10000元;如果一方合作、另一方不合作,那合作的那方就被人騙了,賠5000元,而不合作的那方將分享別人的成果賺2000元;如果都不合作,則不賺不賠。從利己的角度出發(fā),“都不合作”則是壞的納什均衡。 如果在合作前簽署違約條款呢?不合作的那方,賠償對方5000元。這樣一來,不合作的一方將從先前的賺2000元,到賠3000元;而合作的一方則從賠5000元,都不賺不賠。這個時候,“共同合作”就成為新的納什均衡,一個好的均衡。 從這里我們就可以體會到制度的意義:一個制度其實(shí)就是某種博弈規(guī)則,它不僅影響人的行為,還決定著什么樣的納什均衡會出現(xiàn)。 在剛才這個例子當(dāng)中,我們可以設(shè)想這就是人民公社制度?!按箦侊垺钡睦硐胧枪餐辉?,但在這個制度設(shè)計(jì)下,不干活也能吃到飯,偷懶就成了大家的“最優(yōu)策略”,最終形成所有人都不干活的“壞的均衡”。怎么辦呢?“包產(chǎn)到戶”解決了這個問題。偷懶,分不到別人的勞動成果,大家的“最優(yōu)策略”就變成了勤奮,最終形成“好的均衡”。 知道了納什均衡和制度的關(guān)系,我們再去審視身邊的各種游戲規(guī)則,就會發(fā)現(xiàn), 在不同的“制度設(shè)計(jì)”下,有“好的均衡”,也有“壞的均衡”。 比如:價格大戰(zhàn)。壟斷商們都不降價,收益最大。但如果一家悄悄降價,就會搶占巨大利益。所以,降價是壟斷商們的“最優(yōu)策略”,導(dǎo)致利潤微薄的“壞的均衡”。所以,壟斷商們通過“制度設(shè)計(jì)”,組成“托拉斯”,形成價格同盟,走向“好的均衡”。政府接著通過“制度設(shè)計(jì)”,出臺《反托拉斯》法,打破價格同盟,逼著壟斷商們走向“壞的均衡”。 再拿環(huán)保問題舉例,如果沒有相關(guān)的懲罰機(jī)制,每個企業(yè)都會做對自己最有利的事情,只管企業(yè)盈利,隨意偷排污染物,最后的結(jié)局對各方都是最壞的。同樣通過制度設(shè)計(jì),政府會引導(dǎo)企業(yè)往“都關(guān)注環(huán)保”的好的均衡。 還有在企業(yè)管理上,如果沒有分工明確、獎懲分明,最后會導(dǎo)致人浮于事、相互推諉、大家都混日子的壞的均衡,但有了制度約束和激勵,大家會爭相努力、相互幫助和合作,達(dá)成好的均衡。 這樣的例子還有很多,我們身邊很多事,如果大家從利己主義出發(fā),可能會得到壞結(jié)果,但換個思維,也可以通過規(guī)則重新設(shè)計(jì),達(dá)成好的均衡。 總結(jié): 基于理性人的假設(shè)(從利己目的出發(fā)),納什均衡是研究人與人互動情況下什么樣的結(jié)果最可能出現(xiàn),這個最可能出現(xiàn)的結(jié)果就稱為“納什均衡”。并且,這個結(jié)果非常穩(wěn)定,誰單方改變策略,誰就會損失。 不同的游戲規(guī)則,也就是不同的制度下,決定了什么樣的納什均衡會出現(xiàn),有“好的均衡”,也有“壞的均衡”,關(guān)鍵是“制度設(shè)計(jì)”。同時,納什均衡也告訴我們,要協(xié)商、要合作,才能使雙方利益最大化~ |
|